首页 / 专利库 / 工业自动化和数控机床 / 传感器系统 / 用于检测传感器的操作状态的方法和状态机系统

用于检测传感器的操作状态的方法和状态机系统

阅读:14发布:2024-02-15

专利汇可以提供用于检测传感器的操作状态的方法和状态机系统专利检索,专利查询,专利分析的服务。并且本 发明 涉及用于检测 传感器 的操作状态的方法,该方法在状态机中包括:接收与传感器的操作有关的连续监测数据;提供经训练的学习 算法 以用于检测表明传感器功能的传感器的操作状态,其中,根据包括历史数据的 训练数据 集来训练学习算法;通过用经训练的学习算法分析连续监测数据来检测传感器的操作状态;以及提供指示所检测到的传感器的操作状态的输出数据。此外,提供一种状态机系统,该状态机具有一个或多个处理器,其被配置用于进行 数据处理 并执行用于检测传感器的操作状态的方法。,下面是用于检测传感器的操作状态的方法和状态机系统专利的具体信息内容。

1.一种用于检测传感器的操作状态的方法,所述方法在状态机中包括
- 接收与传感器的操作有关的连续监测数据;
- 提供经训练的学习算法以用于检测表明传感器功能的所述传感器的操作状态,其中,根据包括历史数据的训练数据集来训练所述学习算法;
- 通过用所述经训练的学习算法分析所述连续监测数据来检测所述传感器的操作状态;以及
- 提供指示所检测到的所述传感器的操作状态的输出数据。
2.根据权利要求1所述的方法,其中,所述检测包括以下中的至少一个
- 检测所述传感器的制造瑕疵状态,其指示所述传感器的制造过程中的瑕疵;
- 检测所述传感器的故障状态,其指示所述传感器的故障;
- 检测所述传感器的异常状态,其指示传感器操作中的异常;
- 检测所述传感器的血糖指示状态,其指示为其提供所述连续监测数据的患者的血糖指数;以及
- 检测所述传感器的记忆性指示状态,其指示为其提供所述连续监测数据的患者的记忆性患者状态。
3.根据权利要求1或2所述的方法,其中,提供经训练的学习算法包括提供选自以下群组的至少一个学习算法
- K最近邻;
支持向量机
- 朴素贝叶斯;
决策树,如随机森林
- 逻辑回归,如多项式逻辑回归;
- 神经元网络;
- 决策树;以及
贝叶斯网络
4.根据前述权利要求中的至少一项所述的方法,还包括根据包括历史数据的训练数据集来训练学习算法。
5.根据权利要求4所述的方法,其中,所述训练包括根据训练数据集来训练所述学习算法,所述训练数据集包括体内历史训练数据和体外历史训练数据中的至少一个。
6.根据权利要求4和5所述的方法,其中,所述训练包括根据包括连续监测历史数据的训练数据集来训练所述学习算法。
7.根据权利要求4至6中的至少一项所述的方法,其中,所述训练包括根据包括来自以下群组的测试数据的训练数据集来训练所述学习算法:制造测试数据、患者测试数据、经个性化的患者测试数据、包括多个患者数据集的群体测试数据。
8.根据权利要求4至7中的至少一项所述的方法,其中,所述训练包括根据训练数据集来训练所述学习算法,所述训练数据集包括指示来自以下群组的一个或多个传感器相关参数的训练数据:所述传感器的电流值,特别是在连续监测传感器的情况下的工作电极的电流值;所述传感器的电压值,特别是在连续监测传感器的情况下的对电极的电压值,或参考电极与工作电极之间的电压值;测量期间的传感器环境的温度;所述传感器的灵敏度;所述传感器的偏移;以及所述传感器的校准状态。
9.根据权利要求8所述的方法,其中,所述一个或多个传感器相关参数包括以下中的至少一个
- 非互相关的传感器相关参数;以及
- 互相关的传感器相关参数。
10.根据只要引用了权利要求2的前述权利要求中的至少一项所述的方法,还包括根据验证数据集来验证经训练的学习算法,所述验证数据集包括所测量的连续监测数据和/或模拟的连续监测数据,其指示针对传感器的以下中的至少一个:制造瑕疵状态、故障状态、血糖指示状态以及记忆性指示状态。
11.根据前述权利要求中的至少一项所述的方法,还包括以下中的至少一个- 接收包括经压缩的监测数据的连续监测数据;
- 根据包括经压缩的训练数据的训练数据集来训练所述学习算法;以及
- 根据包括经压缩的验证数据的验证数据集来验证经训练的学习算法;
其中,所述经压缩的监测数据、所述经压缩的训练数据、和/或所述经压缩的验证数据是通过线性回归方法和平滑方法中的至少一个确定的。
12.一种状态机系统,具有一个或多个处理器,所述一个或多个处理器被配置用于进行数据处理并执行用于检测传感器的操作状态的方法,所述方法包括
- 接收与传感器的操作有关的连续监测数据;
- 提供经训练的学习算法以用于检测表明传感器功能的所述传感器的操作状态,其中,根据包括历史数据的训练数据集来训练所述学习算法;
- 通过用所述经训练的学习算法分析所述连续监测数据来检测所述传感器的操作状态;以及
- 提供指示所检测到的所述传感器的操作状态的输出数据。

说明书全文

用于检测传感器的操作状态的方法和状态机系统

技术领域

[0001] 本公开涉及用于确定传感器的操作状态的方法和状态机系统。

背景技术

[0002] 文献US 2014/0182350 A1公开了一种用于确定CGM(连续葡萄糖监测)传感器的寿命终止的方法,该方法包括使用寿命终止函数来评估多个险因素以确定传感器的寿命终止状态,以及提供与传感器的寿命终止状态有关的输出。所述多个风险因素选自包括以下的列表:传感器已使用的天数、信号灵敏度是否降低、是否存在预定的噪声模式、是否存在预定的浓度模式、以及参考BG(血液葡萄糖)值和EGV传感器值之间的误差。
[0003] 文献EP 2 335 584 A2涉及一种用于自诊断测试并响应于自诊断测试的结果来设置连续分析物传感器的暂停操作模式的方法。
[0004] 在文献US 2015/164386 A1中,电化学阻抗谱(EIS)与连续葡萄糖监测仪和连续葡萄糖监测(CGM)结合使用,使得能够进行体内传感器校准、总(传感器)瑕疵(fault)分析以及智能传感器诊断和故障检测。定义了等效电路模型,并使用电路元件来表征传感器行为。
[0005] 文献US 2010/323431 A1公开了用于控制具有双稳态段的双稳态显示的控制电路和方法,每个双稳态段能够通过施加电压而在开状态和关状态之间转换。电压从电荷提供给显示驱动器,并根据系统控制器提供的显示指令经由输出从显示驱动器供应给双稳态段中的各个段。检测显示驱动器的输出中的至少一个的双稳态段电压平和该电压的电荷泵电压水平两者,并将其分别与有效的双稳态段电压水平和有效的电荷泵电压水平进行比较。如果所检测到的电压水平中的任一者无效,则可以向系统控制器提供故障信号。发明内容
[0006] 本公开的目的在于提供用于检测传感器的操作状态的状态机系统和方法,其将允许更安全地预测潜在的操作状态问题。
[0007] 为了解决该问题,提出了根据独立权利要求1的用于检测传感器的操作状态的方法。此外,提供了根据独立权利要求12的用于执行用于检测传感器的操作状态的方法的状态机系统。替换实施例从属权利要求的主题。
[0008] 根据一个方面,提供了一种用于检测传感器的操作状态的方法。在状态机中,所述方法包括:接收与传感器的操作有关的连续监测数据;提供经训练的学习算法以用于检测表明传感器功能的所述传感器的操作状态,其中,根据包括历史数据的训练数据集来训练所述学习算法;通过用所述经训练的学习算法分析所述连续监测数据来检测所述传感器的操作状态;以及提供指示所检测到的所述传感器的操作状态的输出数据。
[0009] 根据另一方面,提供了一种状态机系统。所述状态机系统具有一个或多个处理器,其被配置用于数据处理并执行用于检测传感器的操作状态的方法,所述方法包括:接收与传感器的操作有关的连续监测数据;提供经训练的学习算法以用于检测表明传感器功能的所述传感器的操作状态,其中,根据包括历史数据的训练数据集来训练所述学习算法;通过用所述经训练的学习算法分析所述连续监测数据来检测所述传感器的操作状态;以及提供指示所检测到的所述传感器的操作状态的输出数据。
[0010] 根据所提出的技术,将机器学习过程应用于检测传感器的操作状态。藉此,实现了用于通过使用经训练的学习算法来确定传感器的操作状态的预测方法,所述经训练的学习算法是根据训练数据集训练的,并被应用于分析与传感器的操作有关的连续监测数据。
[0011] 例如,可以预测关于传感器的操作的异常和/或故障,从而避免传感器操作中的潜在问题。
[0012] 根据包括历史数据的训练数据集来训练学习算法。如本申请中使用的术语“历史数据”是指在确定操作状态的过程之前收集、检测和/或测量的数据。可以在开始收集为了操作状态检测而接收的连续监测数据之前已检测或收集了历史数据。
[0013] 训练数据集可以是由同一传感器和/或某不同的传感器收集、检测和/或测量的。与针对其来检测操作状态的传感器不同的传感器可以是相同的传感器类型。
[0014] 训练数据集可以包括指示要检测或预测的传感器状态的训练数据。例如,训练数据集可以指示以下中的一个或多个:制造瑕疵状态、故障状态、血糖指示状态和记忆性(anamnestic)指示状态。
[0015] 检测可以包括以下中的至少一个:检测传感器的制造瑕疵状态,其指示传感器的制造过程中的瑕疵;检测传感器的故障状态,其指示传感器的故障;检测传感器的异常状态,其指示传感器操作中的异常;检测传感器的血糖指示状态,其指示为其提供连续监测数据的患者的血糖指数;以及检测传感器的记忆性指示状态,其指示为其提供连续监测数据的患者的记忆性患者状态。可以在制造传感器之后执行传感器的制造瑕疵状态的检测。替换地或附加地,可以在制造过程仍在运行的同时将制造瑕疵状态的检测应用于中间传感器产品(非最终传感器)。类似地,传感器的故障状态的检测可以是制造过程的一部分或与制造过程有关。替换地,通过所提出的技术,例如在应用传感器用于测量的情况下,可以在制造过程完成之后预测传感器的故障状态。传感器的异常状态的检测可以在测量过程中进行,例如在传感器对测量信号的检测正在发生的同时实时地进行。类似地,可以在测量过程正在运行的同时执行对血糖指示状态的检测和对记忆性指示状态的检测中的一个。替换地,可以在测量过程完成之后应用这样的检测。
[0016] 例如,响应于检测到传感器的血糖指示状态,可以确定患者的血糖指数。血糖指数是与特定类型的食物相关联的数字,其指示食物对人的血液葡萄糖(也称为血糖)水平的影响。一百的值可以表示标准,即等价量的纯葡萄糖。附加地或替换地,可以确定其他血糖参数,这样的参数包括血液葡萄糖水平的变化率,加速度,由于例如患者的运动、进餐引起的事件模式,关于传感器的记忆性指示状态的传感器上的机械应。关于记忆性指示状态,可以确定潜在记忆性的数据,诸如hba1c或人口统计数据,比如患者的年龄和/或性别。
[0017] 提供经训练的学习算法可以包括提供选自以下群组的至少一个学习算法:K最近邻、支持向量机、朴素贝叶斯、决策树(诸如随机森林)、逻辑回归(诸如多项式逻辑回归)、神经元网络(neuronal network)、决策树、以及贝叶斯网络。优先考虑的可以是朴素贝叶斯、随机森林和多项式逻辑回归中的一个。在优选实施例中,可以应用随机森林算法,针对该算法分析或自动合并参数之间的相关性和相互作用。
[0018] 在该实施例中,一种方法包括根据包括历史数据的训练数据集来训练学习算法。
[0019] 该方法还可以包括根据包括历史数据的训练数据集来训练学习算法。
[0020] 训练可以包括根据包括体内历史训练数据和体外历史训练数据中的至少一个的训练数据集来训练学习算法。
[0021] 训练可以包括根据包括连续监测历史数据的训练数据集来训练学习算法。
[0022] 训练可以包括根据包括来自以下群组的测试数据的训练数据集来训练学习算法:制造测试数据、患者测试数据、经个性化的患者测试数据、包括多个患者数据集的群体测试数据。训练数据集可以是从这样的不同测试数据中的一个或多个导出的,以针对传感器的一个或多个操作状态来优化训练数据集。
[0023] 训练可以包括根据训练数据集来训练学习算法,所述训练数据集包括指示来自以下群组的一个或多个传感器相关参数的训练数据:传感器的电流值,特别是在连续监测传感器的情况下的工作电极的电流值;传感器的电压值,特别是在连续监测传感器的情况下的对电极的电压值,或参考电极与工作电极之间的电压值;测量期间的传感器环境的温度;传感器的灵敏度;传感器的偏移;以及传感器的校准状态。取决于要检测的操作状态,可以选择所述传感器相关参数中的一个或多个。关于传感器的校准状态,例如,它可以指示何时执行了最后一次校准。
[0024] 这一个或多个传感器相关参数可以包括非互相关的传感器相关参数和互相关的传感器相关参数中的至少一个。两个或更多个传感器相关参数可以是互相关的。在这种情况下,可以通过虑及所有互相关的传感器相关参数来选择互相关的传感器相关参数以用于检测操作状态。不同地,在非互相关的传感器相关参数的情况下,可以选择非互相关的传感器相关参数中的单独一个以用于检测操作状态。非互相关的传感器相关参数可以独立地允许操作状态的检测。
[0025] 该方法还可以包括根据验证数据集来验证经训练的学习算法,所述验证数据集包括所测量的连续监测数据和/或模拟的连续监测数据,其指示针对传感器的以下中的至少一个:制造瑕疵状态、故障状态、血糖指示状态以及记忆性指示状态。
[0026] 该方法还可以包括以下中的至少一个:接收包括经压缩的监测数据的连续监测数据,以及根据包括经压缩的训练数据的训练数据集来训练学习算法,其中,经压缩的监测数据和/或经压缩的训练数据是通过线性回归方法和平滑方法中的至少一个确定的。经压缩的数据可以是对监测数据或训练数据进行尺寸降低的结果。关于平滑方法,可以应用本身已知的核平滑或样条平滑模型或时间序列分析。在压缩的不同阶段,监测数据/训练数据可以包括每秒的数据(测量信号)、每分钟的数据和/或包括特征值(诸如传感器参数、方差、噪声或变化率)的统计数据。
[0027] 可以由传感器来提供连续监测数据,该传感器是用于连续葡萄糖监测(CGM)的完全或部分植入的传感器。一般而言,在CGM的情境中,可以确定指示血液中的葡萄糖值或水平的分析物值或水平。可以在组织液中测量分析物值。该测量可以在皮下或体内执行。CGM可以被实现为几乎实时或准连续的监测过程,从而频繁地或自动地提供/更新分析物值而无需用户干预。在替换实施例中,可以用接触镜片中的生物传感器通过眼液或用皮肤上的生物传感器在汗液中经由透皮测量来测量分析物。CGM传感器可能会停留几天到几周,然后必须更换。
[0028] 关于状态机系统,上述替换实施例可以比照适用。附图说明
[0029] 接下来参考各图描述另外的实施例。在各图中示出了:图1示出了状态机系统的实施例;
图2示出了用于确定传感器的操作状态的方法的实施例的流程图
图3示出了用于学习算法的数据收集的概览;
图4示出了在传感器的工作电极处测量到的电流密度的曲线图;
图5示出了无误差测量;
图6示出了展现出流体学误差(fluidics error)的测量;
图7示出了展现出最大电流误差(maxed out current error)的测量;
图8示出了供学习算法使用的不同参数之间的相关性程度;
图9示出了使用超参数来适配随机森林模型的模型特征的图示;
图10示出了逻辑回归的预测误差的图示;
图11示出了用于逻辑回归的接受者操作特性曲线;
图12示出了用于随机森林模型的树的示例;
图13示出了随机森林的误差的示例性图示;
图14示出了不同的示例性学习算法的准确度的比较。

具体实施方式

[0030] 图1示出了状态机系统1的一个实施例,其也可以称为状态分析系统。状态机系统包括一个或多个处理器2、存储器3、输入接口4和输出接口5。在所示实施例中,输入接口4和输出接口5被提供为单独的模。替换地,输入接口4和输出接口5二者可以集成在单个模块中。
[0031] 在另一实施例中,可以在状态机系统1中提供附加的功能元件7。
[0032] 经由输入接口4在一个或多个处理器2中接收与传感器7的操作有关的连续监测数据。传感器7可以经由线材连接到状态机系统1的输入接口4。替换地或附加地,可以提供诸如蓝牙、WiFi或其他无线技术之类的无线连接。
[0033] 在所示实施例中,传感器7包括感测元件8和传感器电子器件9。在该实施例中,在传感器7的同一壳体中提供感测元件8和传感器电子器件9。替换地,感测元件8和传感器电子器件9可以分离地提供,并且可以使用线材和/或以无线方式来连接。
[0034] 在一个实施例中,可以由传感器7提供连续监测数据,传感器7是用于连续葡萄糖监测(CGM)的完全或部分植入的传感器。一般而言,在CGM的情境中,可以确定指示血液中的葡萄糖值或水平的分析物值或水平。可以在组织液中测量分析物值。该测量可以在皮下或体内执行。CGM可以被实现为几乎实时或准连续的监测过程,从而频繁地或自动地提供/更新分析物值而无需用户干预。在替换实施例中,可以用接触镜片中的生物传感器通过眼液或用皮肤上的生物传感器在汗液中经由透皮测量来测量分析物。
[0035] CGM传感器可能会停留几天到几周,然后必须更换。可以使用发射器来经由无线和/或有线数据传输从传感器向接收器(诸如传感器电子器件9或输入接口4)发送有关指示葡萄糖水平的分析物值或水平的信息。
[0036] 经由输出接口5将指示检测到的传感器7的操作状态的输出数据提供给一个或多个输出装置10。可以想到,任何合适的输出装置可以用作输出装置10。例如,输出装置10可以包括显示装置。替换地或附加地,输出装置10可以包括警报生成器、数据网络和/或一个或多个其他处理装置。在另一实施例中(未示出),提供了一个以上的输出装置10。
[0037] 一个或多个输出装置10可以经由线材连接到状态机系统1的输出接口5。替换地或附加地,可以提供诸如蓝牙、WiFi或其他无线技术之类的无线连接。
[0038] 在替换实施例中,输出装置10或该一个以上的输出装置10中的一个集成在状态机系统1中。
[0039] 在实施例中,一个或多个另外的输入装置11连接到输入接口4。这样的另外的输入装置11可以包括一个或多个另外的传感器,以收集训练数据和/或验证数据以供学习算法使用。附加地或替换地,另外的输入装置11还可以包括用于获取不同数据类型的传感器。这样的不同数据类型的示例是温度数据。可以另外分析这样的不同数据类型的传感器数据以用于检测传感器7的操作状态。附加地或替换地,这样的不同数据类型的传感器数据可以用作训练数据和/或验证数据。替换地或附加地,一个或多个另外的输入装置11可以包括数据网络,外部数据存储装置,诸如键盘鼠标之类的用户输入装置,一个或多个另外的处理装置,和/或适于向状态机系统1提供相关数据的任何其他装置。
[0040] 图2是图示了用于检测传感器的操作状态的方法的一个实施例的流程图。
[0041] 在步骤20中,在状态机系统1的输入接口4中接收与传感器6的操作有关的连续监测数据。
[0042] 连续监测数据可以指示一个或多个传感器相关参数。这样的传感器相关参数可以包括传感器的工作电极的电流值、传感器的对电极的电压值、参考电极与工作电极之间的电压值、测量期间的传感器环境的温度、传感器的灵敏度、偏移、和/或传感器的校准状态。传感器相关参数可以包括非互相关的传感器相关参数、互相关的传感器参数、或其组合。
[0043] 在一个实施例中,连续监测数据可以包括经压缩的监测数据。在这种情况下,通过线性回归方法和平滑方法中的至少一个来确定经压缩的监测数据。
[0044] 在步骤21中,提供经训练的学习算法。根据包括历史数据的训练数据集来训练学习算法。可以在状态机系统1的存储器3中提供经训练的学习算法。替换地,可以从存储器3在一个或多个处理器2中提供经训练的学习算法。在替换实施例中,经由输入接口4提供经训练的学习算法。例如,可以从外部存储装置接收经训练的学习算法。在另外的实施例中,可以在一个或多个附加功能元件7中提供训练的学习算法,或者可以从一个或多个附加功能元件7在一个或多个处理器2中提供经训练的学习算法。
[0045] 在不同的实施例中,步骤20和21的顺序可以颠倒。在特定实施例中,提供经训练的学习算法,只要传感器7投入运行。作为另一替换,步骤20和21可以全部或部分地同时执行。
[0046] 在步骤22中,使用一个或多个处理器2,用经训练的学习算法分析连续监测数据。在并非在处理器2中提供经训练的学习算法的实施例中,处理器2可以访问经训练的学习算法以分析连续监测数据。通过分析连续监测数据,检测传感器7的操作状态。
[0047] 在步骤22中的针对传感器检测到的操作状态可以是几种不同状态之一。例如,可以检测指示传感器的制造过程中的瑕疵的传感器的制造瑕疵状态、指示传感器的故障的传感器的故障状态、指示传感器操作中的异常的传感器的异常状态、指示为其提供连续监测数据的患者的血糖指数的传感器的血糖指示状态、和/或指示为其提供连续监测数据的患者的记忆性患者状态的传感器的记忆性指示状态。
[0048] 接下来,在步骤23中,在输出接口5处提供指示检测到的传感器的操作状态的输出数据。
[0049] 在实施例中,用于检测传感器的操作状态的方法还可以包括根据包括历史数据的训练数据集来训练学习算法。
[0050] 仍然参考图2,在步骤24中,提供了包括历史数据的训练数据集。
[0051] 历史训练数据可以包括体内历史训练数据,其指示在传感器7正在活体受试者上操作中时获取的传感器相关参数。替换地或附加地,历史训练数据可以包括体外历史训练数据,其指示在传感器7没有正在活体受试者上操作中时获取的传感器相关参数。
[0052] 在步骤24中提供的训练数据集可以包括连续监测历史数据。
[0053] 训练数据集可以包括制造测试数据、患者测试数据、经个性化的患者测试数据、和/或包括多个患者数据集的群体测试数据。
[0054] 训练数据可以指示一个或多个传感器相关参数。这样的传感器相关参数可以包括传感器的工作电极的电流值、传感器的对电极的电压值、参考电极与工作电极之间的电压值、测量期间的传感器环境的温度、传感器的灵敏度、偏移、和/或传感器的校准状态。传感器相关参数可以包括非互相关的传感器相关参数、互相关的传感器参数、或其组合。
[0055] 在一个实施例中,训练数据集可以包括经压缩的训练数据。在这种情况下,通过线性回归方法和平滑方法中的至少一个来确定经压缩的训练数据。
[0056] 在步骤25中,根据在步骤24中提供的训练数据集来训练学习算法。
[0057] 可以从合适的算法中选择学习算法。这样的学习算法包括:K最近邻、支持向量机、朴素贝叶斯、决策树(诸如随机森林)、逻辑回归(诸如多项式逻辑回归)、神经元网络、决策树和贝叶斯网络。可以基于是否适合与步骤22中分析的连续监测数据一起使用来选择学习算法。
[0058] 步骤25中的学习算法的训练可以在状态机系统1中进行。在这种情况下,在步骤24中,可以在状态机系统1的存储器3中提供训练数据集。替换地,可以从存储器3在一个或多个处理器2中提供训练数据集。在替换实施例中,经由输入接口4提供训练数据集。例如,可以从外部存储装置接收训练数据集。在另外的实施例中,训练数据集可以被提供在一个或多个附加功能元件7中,或者可以从一个或多个附加功能元件7而被提供在一个或多个处理器2和/或存储器3中。
[0059] 在替换实施例中,步骤25中的学习算法的训练可以在状态机系统1外部进行。在该实施例中,在步骤24中,以使得能够训练学习算法的任何适当的方式提供训练数据集。
[0060] 另一实施例可以包括步骤26,其中根据验证数据集来验证经训练的学习算法。验证数据集包括测量出的连续监测数据和/或模拟的连续监测数据。该数据指示针对传感器的以下中的至少一个:制造瑕疵状态、故障状态、血糖指示状态和记忆性指示状态。
[0061] 步骤26中的经训练的学习算法的验证可以在状态机系统1中进行。在这种情况下,可以在状态机系统1的存储器3中提供验证数据集。替换地,可以从存储器3在一个或多个处理器2中提供验证数据集。在替换实施例中,经由输入接口4提供验证数据集。例如,可以从外部存储装置接收验证数据集。在另外的实施例中,验证数据集可以被提供在一个或多个附加功能元件7中,或者可以从一个或多个附加功能元件7而被提供在一个或多个处理器2和/或存储器3中。
[0062] 在替换实施例中,步骤26中的经训练的学习算法的验证可以在状态机系统1外部进行。在该实施例中,以使得能够验证学习算法的任何适当的方式提供验证数据集。
[0063] 在一个实施例中,验证数据集可以包括经压缩的验证数据。在这种情况下,通过线性回归方法和平滑方法中的至少一个来确定经压缩的验证数据。
[0064] 接下来描述另外的方面。
[0065] 用于收集连续监测数据的测量是利用多个连续葡萄糖监测传感器执行的。
[0066] 基于数据挖掘领域中已确立的工作步骤序列(对照Shmueli等人的Data Mining for Business analytics – Concepts, Techniques, and Applications with XLMiner(用于商业分析学的数据挖掘——关于XLMiner的概念、技术和应用),第三版,纽约:约翰威利及其子弟,2016年),其将用来为模型开发提供支持,可以实现以下全部或部分步骤:1. 草拟问题
2. 取得数据
3. 分析和清理数据
4. 降低尺寸,如果需要的话
5. 指定问题(分类、聚类、预测)
6. 在训练中共享数据。验证和测试数据集。
7. 选择数据挖掘技术(回归、神经元网络等)
8. 算法的不同版本(不同的变量)
9. 解释结果
10. 将模型整合到现有系统中。
[0067] 接下来描述用于数据收集的过程,其可以应用在替换实施例中。
[0068] 在测试站点处,可以每个通道每秒记录一次传感器的工作电极的电流值、传感器的对电极的电压值、参考电极与工作电极之间的电压值。可以每分钟检测一次传感器所位于的溶液的温度。这些参数可以存储在可扩展标记语言(XML)文件中。然后,数据处理程序CoMo捕获该XML文件,并以SAS数据集的形式将其提供为所谓的实验。在最低阶段,该实验由参考一秒钟的数据组成。如图3所示,借助于CoMo将该数据压缩为分钟值。在该步骤中,附加地生成描述性统计数据,例如每分钟的最小值、平均值和最大值。然后进行到步长值(step value)中的压缩。如图4所示,可以观察到金字塔形状的各步长。最后一个压缩阶段即基本统计,对应于每个传感器的特征值报告。
[0069] 首先,可以使用来自最高压缩阶段(即基本统计)的数据,因为对更复杂数据的访问可以保留给使用较简单数据的分类提供不充分的结果的情况。此外,时间分辨数据的分类(如在第一阶段和第二阶段中出现的那样)将需要不同的编程语言,诸如Python。
[0070] 在一个示例中,在256个数据条目中识别出了多个测试序列,诸如16个测试序列,其被分发给测试站点,得到结果,乘以多个通道。
[0071] 针对每个传感器的误差识别,考虑根据图4的每个通道每分钟在工作电极处的电流强度的曲线图图示。对于7天的测量,每天以单独的曲线表示。由于传感器经过以预膨胀的形式的一天的准备才能运行,因此只图示了六天。从图4可以清楚地看到,在第三天,通道4与其他天明显不同,因此不再遵循典型的金字塔形状。因此,通道4被识别为有问题。
[0072] 一旦分析并识别了所有通道,就可以将测试序列从SAS导出到存储器。在最后一步中,可以从该存储器中以R来读取测试序列,并将其存储为参考。
[0073] 整个数据集分为三个部分:表示连续监测数据的测试数据集、训练数据集以及验证数据集。
[0074] 在替换实施例中,要通过模型来识别表示传感器的操作状态的两种类型的误差。这两种类型的误差是流体学误差和最大电流误差。如图5所示,没有误差的通道最初可以被视为参考。如图4所示,可以观察到金字塔形状。然而,这些天并非在图形上叠加,而是连续地排列。由于借助于电流强度来决策通道是否被识别为有问题,因此电流强度也用于关于各个误差的分析。
[0075] 在该实施例中,流体学误差是误差检测的焦点。因此,选择具有大量的此类缺陷的来自一段时间的数据。与该误差类型相关联的一个困难是其可能发生于其中的各种各样的表征。然而,如图6所示,可以观察到测量值趋于降低。此误差的原因位于测试站点单元中,因此该缺陷也可以称为测试站点误差。据推测,其原因是测试系统中的气泡,其可能是由例如温度波动引起的。液体中的气泡可能由于流入中断而形成。
[0076] 当在测试开始时将传感器插入通道时,可能会出现最大电流误差。当检测到高于阈值的电流时,将测试站点处的传感器标记有该误差类型。现在,测试站点处的工作人员可以将传感器重新插入通道中,从而处理该误差。替换地,该传感器可能最终被标记为有问题。图7示出了典型的最大电流误差。与图6相比,可以在测量开始时识别出明显更高的电流值。
[0077] 为了能够以有意义的方式标记数据,可以根据表1为各个误差提供不同的误差代码。
[0078] 表1:
[0079] 参数分析在替换实施例中,变量之间的线性联系的强度可以借助于相关性系数来确定,相关性系数的值可以在-1与1之间。在值为1的情况下,存在高的正线性相关性。在看图8时,可以看到参数S360与大量其他参数相关。
[0080] 如上所述,可以存在诸如电流之类的变量,其可以直接在测试站点处测量。在实施例中,在压缩数据时,使用线性模型以及样条模型,其估计各种参数。由于稍后要使用的数据集包括经压缩的数据,因此考虑综合模型。
[0081] 测量值对于关于表示传感器相关参数的测量值的描述性统计,可能对可以根据DIN 53804-1借助于分位数-分位数图(Quantil-Quantil plot)以图形方式实现的正态分布条件的分析感兴趣。QQ图的X轴由理论分位数来定义,而Y轴由经验分位数来定义。正态分布的参数得到一条直线,其在QQ图中被图示为直线。此外,还有各种正态分布测试,诸如卡方测试或Shapiro-Wilk测试。这些假设测试将零假设定义为存在正态分布,相反,替换假设则假定不存在正态分布。这些测试方法对于偏差高度敏感。在实施例中,因此可以借助于QQ图针对每个参数分析正态分布。
[0082] 测量值可以包括针对不同葡萄糖浓度的传感器电流。这些可以被确定为某些时间段中值,并且可以附加地或替换地被求平均。测量值还可以包括传感器的灵敏度。附加地或替换地,测量值可以包括表征描述测量值(诸如传感器电流)的曲线图的参数。这些可以例如包括漂移和/或曲率。附加地或替换地,值可以包括关于其他测量值的统计值。可以采用诸如线性模型和/或样条模型之类的不同模型来近似测量值。可以在不同的葡萄糖浓度下和/或针对不同的时间段确定测量值和参数中的全部或任何。
[0083] 学习算法在替换实施例中,选择了用于学习算法的几种建模方法(参见例如Domingos的A Few Useful Things to Know About MachineLearning(关于机器学习要知道的几个有用内容),Commun. ACM 55.10,S. 78-87. DOI:10.1145/2347736.2347755,2012年),并对其优缺点进行了分析。另外,可以就这些方法对问题的兼容性方面分析所述方法,以便能够进行方法选择。接下来描述示例性方法(Sammut等人的Encyclopedia of Machine Learning(机器学习百科全书),第一版,施普林格出版股份有限公司,2011年)。表2总结了这些方法的优缺点。
[0084] K最近邻该方法的目标是将对象分类到训练量的相似对象已被分类到的类别中,从而将出现频率最高的类别作为结果输出。为了确定对象的接近度,使用相似性测量,诸如例如欧几里得距离。该方法非常适于明显更大的数据量,而本示例中不存在这样大的数据量。这也是为什么没有将此模型纳入对照考虑的原因。
[0085] 支持向量机在此方法中,计算超平面,该超平面将对象分类为类别。为了计算超平面,要最大化围绕类别边界的距离,因此支持向量机是“大边缘分类器”之一。此方法的一个重要假设是数据的线性可分离性,然而,可以借助于核技巧将其扩展到更高维的向量空间。对于具有较少过拟合的分类,需要大数据量,而这在一些实施例中不存在。
[0086] 朴素贝叶斯朴素假设为,当前变量在统计上是相互独立的。在大多数情况下,此假设是不正确的。
尽管如此,朴素贝叶斯在许多情况下得到良好的效果,使得即使属性之间的相关性很小也得到较高的正确分类率。朴素贝叶斯的特点在于简单的操作模式,因此可以用于模型选择。
[0087] 逻辑回归至于逻辑回归,针对关于因变量的特征在多大程度上可归因于自变量的值的分析计算可能性。
[0088] 神经元网络人工神经元网络是基于大脑中神经元的生物学结构。简单的神经元网络由布置成三层的神经元组成。这些层是输入层隐藏层输出层。在各层之间,所有神经元通过权重相互连接,在训练阶段逐步优化所述权重。目前,神经元网络在许多领域都得到了广泛使用,因此包含了大量模型变化。存在多个超参数,必须从经验值中确定这些超参数以优化这样的网络。在一些实施例中,出于时间效率的原因,未确定这些超参数。
[0089] 决策树决策树是经过排序的分层树,其特征在于其简单易懂的外观。靠近根的节点比靠近叶的节点对于分类更有意义。在一个实施例中,由于决策树经常遇到由过度拟合引起的问题这一事实,因此选取随机森林方法进行模型选择。该方法由多个决策树组成,藉此每个树表示部分数量的变量。
[0090] 贝叶斯网络贝叶斯网络是有向图,它图示出多变量似然分布。网络的节点对应于随机变量,并且边示出了它们之间的关系。可能的应用可以是在诊断中说明疾病症状的原因。为了开发贝叶斯网络,需要能够尽可能详细地描述变量之间的依赖性。由于一些实施例中处理的误差,这样的图的生成并不可行。
[0091] 表2:
[0092] 方法选择在替换实施例中,最初从理论上考虑模型,并就其假设来分析它们,接下来进行第一种实现,然后可以借助于各种方法对其进行优化。
[0093] 在第一步中,可以使用具有线性模型的二元问题,其包括总数为三的变量。随后可以基于实际问题,用所有类别和参数来训练由模型表示的学习算法。最后,可以借助于诸如随机森林情况下的决策树数量之类的超参数来关于手头的数据对模型特征进行适配。图9中以随机森林模型为例例示了关于该过程的图示。缩写ACC表示准确度,该准确度随着第一次适配而降低,但随后借助于交叉验证随着优化步骤而再次提高。
[0094] 朴素贝叶斯:可以在实施例中使用的该模型是基于贝叶斯定理,并且可以用作用于对数据进行分类的简单且快速的方法。在这样的实施例中,条件为:存在的数据在统计上彼此独立并且处于正态分布。由于该方法仅单次就可以确定数据的相对频率,因此其被认为是一种简单且快速的方法。
[0095] 根据贝叶斯定理,以下公式用于计算有条件似然:。
[0096] 当假定属性彼此独立存在时,朴素贝叶斯分类器可以定义如下:。
[0097] 此函数始终借助最大后验规则来预测针对属性xi的最可能类别y。最大后验规则的行为类似于最大似然法,但具有先验项的知识。当数据集中存在度量数据时,需要分布函数以便针对P(xi|y)计算有条件似然。在实施例中,朴素贝叶斯也可能诉诸于正态分布(Berthold等人的Guide to Intelligent Data Analysis: How to Intelligently Make Sense of Real Data(智能数据分析指南:如何机智地解读实时数据),第一版,施普林格出版股份有限公司,2010年)。尽管在许多CGM变量的情况下不存在正态分布,但仍可以使用朴素贝叶斯,因为尽管与正态分布略有偏差,它仍可以实现较高的正确分类率。
[0098] ,针对每个属性xi和每个类别y计算平均值μ和方差σ。
[0099] 由于在该模型的情况下较小的数据集足以进行良好的预测,因此在一个实施例中可以仅使用四个测量值作为输入。在一个实施例中,作为第一考虑,可以选择部分量的可用参数,包括A2、I90和D。
[0100] 在I90出现在一个类别中的条件下,可以使用朴素贝叶斯来确定误差的概率。
[0101] 在一个实施例中,关于误差类型不应做任何陈述。因此,无需进行新的数据识别,可以选择仅包含流体学误差的四个测试站点。在这种情况下,一般来说,误差代码0可以被识别为无误差,并且误差代码1可以被识别为误差。表3例示了朴素贝叶斯的一个实施例的输入数据集的摘录。
[0102] 表3:
[0103] 如表4所示,模型输出可以包括针对类别计算的先验值。在下一步中,可以计算类别0(无误差)和类别1(误差)的每个变量的平均值以及标准差。它们可以用来基于正态分布确定变量的分布函数。
[0104] 表4:
[0105] 可以借助于输出的各种参数来评估模型的质量。如表5所示,在一个实施例中,从该输出来看,准确度、灵敏度和特异性可能具有主导意义。
[0106] 表5:
[0107] 在一个实施例中,准确度允许关于模型结果的第一印象,因此可以用于评估质量。
[0108] 在某些实施例中,为了能够评估准确度的重要性,可以使用Kappa值。Kappa值是两个质量参数——在该实施例中为观察到的准确度与预期准确度——的对应性的统计量度。在计算出了观察到的准确度和预期准确度之后,可以如下确定Kappa值:

[0109] 存在不同的方法来解释Kappa值。表6总结了一种这样的方法,该方法可从(Landis等人的The Measurement of Observer Agreement for Categorical Data(针对分类数据的观察者协议的测量),Biometrics 33,S. 159–174,1977年)中获悉:表6:
[0110] 在一个实施例中,可以确定阳性预测值、阴性预测值、灵敏度和特异性。
[0111] 阳性预测值指定在已被分类为有问题的所有结果中已被正确分类为有问题的值的百分比(对应于四字段表(four-field table)的第二行)。
[0112] 相应地,阴性预测值指定已被分类为无误差的所有结果中已被正确分类为无误差的值的百分比(对应于四字段表的第二行)。
[0113] 灵敏度指定已被正确分类为阳性的对象在实际阳性测量中的百分比。
[0114] 特异性指定已被正确分类为阴性的对象在确实是阴性的测量中的百分比。
[0115] 在实施例中,可以通过四字段表来例示具有变量A2、D和I90的二元模型以及整体模型的预测。在表7所示的实施例中,二元模型在假阴性率的区域中具有最大的困难,这反映在≈0.7857的灵敏度中。
[0116] 表7:
[0117] 在替换实施例中,在二元问题的情境中讨论了朴素贝叶斯之后,然后可以在第二阶段突出显示所有的误差类型和变量。该实现可以是基于所有可用数据。如果准确度以及Kappa值在这两个模型版本中的行为相似,则可以巩固数据较少的朴素贝叶斯已经可以得到良好结果的论点。
[0118] 逻辑回归可以如本身已知的那样实现逻辑回归(Backhaus等人的Multivariate 
Analysemethoden: Eine anwendungsorientierte Einführung(多元分析方法:面向应用的介绍),施普林格,柏林海德堡,2015年)。逻辑回归可以用来确定自变量和因变量的表现之间的联系。通常,二元因变量Y编码为0或1,即1为存在误差,0为不存在误差。逻辑回归在CGM情境中的可能应用是确定电流值、样条和灵敏度是否与误差的表现有关。
[0119] 在实施例中,可以使用广义线性模型来实现逻辑回归(参见例如Dobson的An Introduction to Generalized Linear Models(广义线性模型简介),第二版,查普曼和霍尔/CRC的统计科学教科书,泰勒和弗朗西斯,2010年)。由于线性模型易于解释,因此这可能是有利的。
[0120] 评价:表8示出了使用变量I90、A2和D的一个实施例的简化模型与使用所有变量的模型的比较。在该实施例中,使用所有变量的模型的准确度比简化模型的准确度高约7%,这表明简化模型不使用与分类密切相关的变量。
[0121] 表8:
[0122] 可以使用“向后消除”(Sheather的A Modern Approach to Regression with R(使用R进行回归的现代方法),施普林格科学与商务媒体,2009年)和Akaike信息标准(Aho Ket等人的Model selection for ecologists: the worldviews of AIC and BIC(生态学家的模型选择:AIC和BIC的世界观),生态学,95: 631–636,2014年)来识别相关参数。可以关于逻辑回归的预测误差来检查这些参数。图10示出了针对一个实施例的变量的分布密度以及错误预测值的位置。由于在分布的边缘以及在没有误差的测量区域中存在错误预测值,因此在该实施例中,不可能通过简单的关联规则来正确预测所有有问题的测量。
[0123] 在实施例中,可以使用接受者操作特性曲线(ROC)来确定灵敏度和特异性。在这种情况下,理想曲线在开始时竖直上升,意味着误差率为0%,而假阳性率仅在稍后上升。沿对线的曲线暗示了随机过程。图11示出了针对示例性实施例的用于逻辑回归的ROC。
[0124] 多项式逻辑回归:在多项式逻辑回归中,因变量X可能具有两个以上的不同值,这使得二元逻辑回归成为多项式逻辑回归的特殊情况。
[0125] 随机森林随机森林遵循装袋(Bagging)原理,该原理指出,多种分类方法的组合可通过用数据的不同样本训练几种分类来提高分类的准确度。在实施例中,可以使用如本身已知的随机森林算法(Breiman的Random Forests(随机森林),Mach. Learn. 45.1,S. 5–32. DOI:
10.1023/A:1010933404324,2001年)。
[0126] 在这样的实施例中,当新的元素被馈送到决策树时,每个树确定类别作为结果。在下一步中,基于大多数的树所提出的类别来确定结果类别。图12示出了一个示例性实施例的树。
[0127] 可以使用例如树的数量和/或树中的节点的数量来优化随机森林。在图13中,示出了针对一个实施例的随机森林的误差的示例,其中关于最大电流误差的误差概率在50%至100%之间振荡。在此示例中,所有“其他误差”都被错误地分类,如从顶部的线可以看出的那样。这可能是由于少量出现最大电流误差和其他误差。
[0128] 图14示出了替换实施例的示例性学习算法的准确度的比较:多项式逻辑回归、朴素贝叶斯和随机森林。左侧显示了准确度的置信度区间。右侧示出了每个模型的Kappa值。
[0129] 对于该实施例,Kappa值允许假设趋势,根据该趋势,多项式逻辑回归的准确度与其他模型相比不那么显著。
[0130] 该假设通过对本实施例的测试数据集的训练模型的预测得到了证实,这在表9中总结的四字段表中进行了例示。随机选择测试数据集的测量值,以模拟实际数据输入。尽管测试数据集中没有出现最大电流误差,但多项式逻辑回归错误地预测了该误差类型。然而,该模型存在的最大问题是流体学误差,而没有一个案例正确分类了该误差。
[0131] 表9:
[0132] 因此,对于该实施例,多项式逻辑回归对应于66%的准确度,因此低于具有80%的正确分类案例的朴素贝叶斯和具有88%的正确分类案例的随机森林。造成这样的情况的第一个可能原因可能是参数之间的相关性,这可能导致估计失真和标准差增加。然而,朴素贝叶斯还要求参数不相关,并且对于所示实施例,该模型得到明显更好的结果。其原因可能是朴素贝叶斯已经可以以非常小的数据量得到高准确度。通过用更高的数据量来训练模型,不管参数的相关性如何,朴素贝叶斯的准确度都会大幅提高。然而,也可能违反多项式逻辑回归的第二个假设,即“无关备选的独立性”。该假设指定两种误差类型的优势比与所有其他响应类别无关。例如,可以假设结果类别“流体学误差”或“无误差”的选择不受“其他误差”的存在的影响。
[0133] 在实施例中,随机森林提供86%的正确分类案例的最高比率,由此,即使存在流体学误差,多个错误分类的案例也被预测为“无误差”。在该实施例中随机森林表示关于预测的最成功模型的原因可能在于,一方面,树结构使得可以关于它们的相互作用来布置参数。另一方面,由于树的数量,与多项式逻辑回归和以R的朴素贝叶斯相比,随机森林可以不费什么力气就得到优化。这可以借助于与决策树的数量有关的误差的曲线图来实现,该曲线图示出了误差收敛时的决策树的数量。
[0134] 作为经压缩的数据的替换,可以使用未经压缩的数据。对于展现出时间分辨率的数据,可以使用神经元网络(诸如递归网络)来实现预测。递归神经元网络的优势在于,在创建模型之前无需做出任何假设。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈