首页 / 专利库 / 人工智能 / 异常检测 / 基于联合历史和时间序列分析的异常表征的系统和方法

基于联合历史和时间序列分析的异常表征的系统和方法

阅读:673发布:2020-05-11

专利汇可以提供基于联合历史和时间序列分析的异常表征的系统和方法专利检索,专利查询,专利分析的服务。并且本 发明 题为“基于联合历史和时间序列分析的异常表征的系统和方法”。本发明公开了一个实施方案,其提供了一种用于促进 异常检测 和表征的系统。在操作期间,该系统通过计算设备确定包括多个数据点的第一组测试数据,其中第一组包括第一变量和一个或多个第二变量的数据序列。该系统通过将第一组分成多个组并且对每个相应组中的数据执行四分位距分析来识别异常。该系统从第一组获取第二组测试数据,该第二组测试数据包括来自在当前时间之前出现的最近时间段的数据序列,并且还包括来自所识别的异常的第一数据点。该系统基于第二组的导数的量值是否大于第一预先确定的 阈值 而将第一数据点分类为第一类型的异常。,下面是基于联合历史和时间序列分析的异常表征的系统和方法专利的具体信息内容。

1.一种用于促进异常检测和表征的计算机实现的方法,所述方法包括:
由计算设备确定包括多个数据点的第一组测试数据,其中所述第一组包括第一变量和一个或多个第二变量的数据序列,并且其中所述一个或多个第二变量取决于所述第一变量;
通过将所述第一组测试数据分成多个组并且对每个相应组中的数据执行四分位距分析来识别异常;
从所述第一组测试数据获取第二组测试数据,所述第二组测试数据包括来自在当前时间之前小于预先确定的时间段处出现的最近时间段的数据序列,并且还包括来自所识别的异常的第一数据点;以及
基于所述第二组测试数据的导数的量值是否大于第一预先确定的阈值而将所述第一数据点分类为第一类型的异常,
从而基于对所述第一组测试数据的历史分析和对所述第二组测试数据的最近时间序列分析来增强所述数据序列的数据挖掘和异常值检测。
2.根据权利要求1所述的方法,其中所述第一变量或所述一个或多个第二变量为以下中的一者或多者:
参数,所述参数与参与获取所述第一组测试数据的物理设备相关联,
其中所述参数为以下中的一者或多者:
温度值;
计数、数量或其他单位,所述计数、数量或其他单位用于测量生产;
材料的流量单位或量度;
材料的压单位或量度;和
任何参数,所述任何参数能够在测量另一个参数时用作控制参数。
3.根据权利要求2所述的方法,其中所述物理设备是传感器、智能仪表、物联网(IoT)设备和能够测量所述参数的任何设备中的一者或多者。
4.根据权利要求1所述的方法,还包括:
响应于确定所述第二组测试数据的所述导数的所述量值大于所述第一预先确定的阈值而将所述第一数据点分类为所述第一类型的异常;以及
响应于确定所述第二组测试数据的所述导数的所述量值不大于所述第一预先确定的阈值而将所述第一数据点分类为第二类型的异常。
5.根据权利要求4所述的方法,
其中所述第一类型的异常与以下中的一者或多者相关联:
控制参数的浪涌;
开/关事件;和
所述控制参数的突然瞬时变化;并且
其中所述第二类型的异常与稳态异常相关联。
6.根据权利要求5所述的方法,还包括:
通过确定被分类为异常并且能够归因于所述控制参数的浪涌、所述开/关事件或所述控制参数的所述突然瞬时变化的第三组数据点来检测指示与参与获取所述第一组测试数据的物理设备相关联的高浪涌的趋势。
7.根据权利要求6所述的方法,还包括:
响应于确定所述趋势不大于第二预先确定的阈值,确定所述物理设备正在经历正常操作;以及
响应于确定所述趋势大于所述第二预先确定的阈值,确定所述物理设备正在经历劣化。
8.根据权利要求1所述的方法,还包括:
由所述计算设备的用户基于一组预先确定的条件将所述第一数据点分类为所述第一类型的异常;
由所述计算设备的所述用户执行处理所分类的异常的动作,
其中所述动作包括以下中的一者或多者:
补救或纠正动作,用以确保所分类的异常不再发生;
调节影响所述第一变量或所述一个或多个第二变量的物理参数;以及
调节从中获取所述数据序列的设备的物理部件。
9.一种用于促进异常检测和表征的计算机系统,所述计算机系统包括:
处理器;和
存储设备,所述存储设备存储当由所述处理器执行时使得所述处理器执行一种方法的指令,所述方法包括:
由计算设备确定包括多个数据点的第一组测试数据,其中所述第一组包括第一变量和一个或多个第二变量的数据序列,并且其中所述一个或多个第二变量取决于所述第一变量;
通过将所述第一组测试数据分成多个组并且对每个相应组中的数据执行四分位距分析来识别异常;
从所述第一组测试数据获取第二组测试数据,所述第二组测试数据包括来自在当前时间之前小于预先确定的时间段处出现的最近时间段的数据序列,并且还包括来自所识别的异常的第一数据点;以及
基于所述第二组测试数据的导数的量值是否大于第一预先确定的阈值而将所述第一数据点分类为第一类型的异常,
从而基于对所述第一组测试数据的历史分析和对所述第二组测试数据的最近时间序列分析来增强所述数据序列的数据挖掘和异常值检测。
10.根据权利要求9所述的计算机系统,其中所述第一变量或所述一个或多个第二变量为以下中的一者或多者:
参数,所述参数与参与获取所述第一组测试数据的物理设备相关联,
其中所述参数为以下中的一者或多者:
温度值;
计数、数量或其他单位,所述计数、数量或其他单位用于测量生产;
材料的流量单位或量度;
材料的压力单位或量度;和
任何参数,所述任何参数能够在测量另一个参数时用作控制参数。
11.根据权利要求10所述的计算机系统,其中所述物理设备是传感器、智能仪表、物联网(IoT)设备和能够测量所述参数的任何设备中的一者或多者。
12.根据权利要求9所述的计算机系统,其中所述方法还包括:
响应于确定所述第二组测试数据的所述导数的所述量值大于所述第一预先确定的阈值而将所述第一数据点分类为所述第一类型的异常;以及
响应于确定所述第二组测试数据的所述导数的所述量值不大于所述第一预先确定的阈值而将所述第一数据点分类为第二类型的异常。
13.根据权利要求12所述的计算机系统,
其中所述第一类型的异常与以下中的一者或多者相关联:
控制参数的浪涌;
开/关事件;以及
所述控制参数的突然瞬时变化;并且
其中所述第二类型的异常与稳态异常相关联。
14.根据权利要求13所述的计算机系统,其中所述方法还包括:
通过确定被分类为异常并且能够归因于所述控制参数的浪涌、所述开/关事件或所述控制参数的所述突然瞬时变化的第三组数据点来检测指示与参与获取所述第一组测试数据的物理设备相关联的高浪涌的趋势。
15.根据权利要求14所述的计算机系统,其中所述方法还包括:
响应于确定所述趋势不大于第二预先确定的阈值,确定所述物理设备正在经历正常操作;以及
响应于确定所述趋势大于所述第二预先确定的阈值,确定所述物理设备正在经历劣化。
16.根据权利要求9所述的计算机系统,其中所述方法还包括:
由所述计算设备的用户基于一组预先确定的条件将所述第一数据点分类为所述第一类型的异常;
由所述计算设备的所述用户执行处理所分类的异常的动作,其中所述动作包括以下中的一者或多者:
补救或纠正动作,用以确保所分类的异常不再发生;
调节影响所述第一变量或所述一个或多个第二变量的物理参数;以及
调节从中获取所述数据序列的设备的物理部件。
17.一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储当由计算机执行时使得所述计算机执行一种方法的指令,所述方法包括:
由计算设备确定包括多个数据点的第一组测试数据,其中所述第一组包括第一变量和一个或多个第二变量的数据序列,并且其中所述一个或多个第二变量取决于所述第一变量;
通过将所述第一组测试数据分成多个组并且对每个相应组中的数据执行四分位距分析来识别异常;
从所述第一组测试数据获取第二组测试数据,所述第二组测试数据包括来自在当前时间之前小于预先确定的时间段处出现的最近时间段的数据序列,并且还包括来自所识别的异常的第一数据点;以及
基于所述第二组测试数据的导数的量值是否大于第一预先确定的阈值而将所述第一数据点分类为第一类型的异常,
从而基于对所述第一组测试数据的历史分析和对所述第二组测试数据的最近时间序列分析来增强所述数据序列的数据挖掘和异常值检测。
18.根据权利要求17所述的方法,还包括:
响应于确定所述第二组测试数据的所述导数的所述量值大于所述第一预先确定的阈值而将所述第一数据点分类为所述第一类型的异常;以及
响应于确定所述第二组测试数据的所述导数的所述量值不大于所述第一预先确定的阈值而将所述第一数据点分类为第二类型的异常。
19.根据权利要求18所述的方法,
其中所述第一类型的异常与以下中的一者或多者相关联:
控制参数的浪涌;
开/关事件;和
所述控制参数的突然瞬时变化;并且
其中所述第二类型的异常与稳态异常相关联。
20.根据权利要求19所述的方法,还包括:
通过确定被分类为异常并且能够归因于所述控制参数的浪涌、所述开/关事件或所述控制参数的所述突然瞬时变化的第三组数据点来检测指示与参与获取所述第一组测试数据的物理设备相关联的高浪涌的趋势;
响应于确定所述趋势不大于第二预先确定的阈值,确定所述物理设备正在经历正常操作;以及
响应于确定所述趋势大于所述第二预先确定的阈值,确定所述物理设备正在经历劣化。

说明书全文

基于联合历史和时间序列分析的异常表征的系统和方法

[0001] 本公开整体涉及检测异常。更具体地讲,本公开涉及用于基于联合历史和时间序列分析的异常表征的系统和方法。
[0002] 异常检测或异常值检测是一种数据挖掘方法,其识别不符合预期模式或数据组中的其他模式的项目或事件。异常检测与各种领域相关,例如,制造、医疗领域和能源相关领域。例如,在制造中,能源使用可引起显著的成本,诸如在运行具有机器的工厂或具有设备的数据中心时。为此,识别异常可提供更有效的制造系统,这继而可降低成本并且改善系统以及其组成部件或零件的总体效率。
[0003] 随着智能仪表、传感器物联网(IoT)设备的出现,存在用以监测工厂机器的低效率以及检测和管理异常的能源使用的机会。相关美国专利申请16/143,223涉及一种通过对二维或更高维度数据组的时间序列数据使用历史范围和分箱四分位距分析来促进异常检测的方法。然而,目前无法区分(一方面)减少能量或生产率损失的真正机会与(另一方面)来自快速瞬时事件(例如,电源开/关、突然温度变化和突然的生产平提高)的不可控的电源浪涌。这可能导致用于数据挖掘和异常检测的系统效率低下。
[0004] 一个实施方案提供了一种用于促进异常检测和表征的系统。在操作期间,该系统通过计算设备确定包括多个数据点的第一组测试数据,其中所述第一组包括第一变量和一个或多个第二变量的数据序列,并且其中所述一个或多个第二变量取决于所述第一变量。该系统通过将所述第一组测试数据分成多个组并且对每个相应组中的数据执行四分位距分析来识别异常。该系统从所述第一组测试数据获取第二组测试数据,所述第二组测试数据包括来自在当前时间之前小于预先确定的时间段处出现的最近时间段的数据序列,并且还包括来自所识别的异常的第一数据点。该系统基于所述第二组测试数据的导数的量值是否大于第一预先确定的阈值而将所述第一数据点分类为第一类型的异常,从而基于对所述第一组测试数据的历史分析和对所述第二组测试数据的最近时间序列分析来增强所述数据序列的数据挖掘和异常值检测。
[0005] 在一些实施方案中,第一变量或一个或多个第二变量为以下中的一者或多者:与参与获取第一组测试数据的物理设备相关联的参数。参数为以下中的一者或多者:温度值;用于计量生产的计数、数量或其他单位;材料的流量单位或量度;材料的压单位或量度;
以及能够在测量另一个参数时用作控制参数的任何参数。
[0006] 在一些实施方案中,物理设备是传感器、智能仪表、物联网(IoT)设备以及能够测量所述参数的任何设备中的一者或多者。
[0007] 在一些实施方案中,该系统响应于确定所述第二组测试数据的所述导数的所述量值大于所述第一预先确定的阈值而将所述第一数据点分类为所述第一类型的异常。该系统响应于确定所述第二组测试数据的所述导数的所述量值不大于所述第一预先确定的阈值而将所述第一数据点分类为第二类型的异常。
[0008] 在一些实施方案中,第一类型的异常与以下中的一者或多者相关联:控制参数的浪涌;开/关事件;以及控制参数的突然瞬时变化。第二类型的异常与稳态异常相关联。
[0009] 在一些实施方案中,该系统通过确定被分类为异常并且可归因于所述控制参数的浪涌、所述开/关事件或所述控制参数的所述突然瞬时变化的第三组数据点来检测指示与参与获取所述第一组测试数据的物理设备相关联的高浪涌的趋势。
[0010] 在一些实施方案中,响应于确定所述趋势不大于第二预先确定的阈值,该系统确定所述物理设备正在经历正常操作。响应于确定所述趋势大于所述第二预先确定的阈值,该系统确定所述物理设备正在经历劣化。
[0011] 图1示出了根据本发明的实施方案的用于促进异常检测和表征的示例性环境。
[0012] 图2A示出了根据本发明的实施方案的具有示例性测试数据的曲线图,其包括一段时间内的二维数据组的聚集快照。
[0013] 图2B示出了根据本发明的实施方案的图2A的示例性测试数据的曲线图,其包括对已被分成bin或组的测试数据执行四分位距分析。
[0014] 图2C示出了根据本发明的实施方案的从图2A的示例性测试数据获取的数据的曲线图,其包括来自二维数据组的每个变量的最近时间段的时间序列数据以及与电源浪涌相关联的异常的表征。
[0015] 图2D示出了根据本发明的实施方案的基于图2A的示例性测试数据的结果的表,其包括可被分类为异常的特定数据点的表征或原因。
[0016] 图2E呈现了根据本发明的实施方案的示例性最近时间序列分析,其包括与电源浪涌相关联的异常的表征。
[0017] 图3A呈现了根据本发明的实施方案的示出用于促进异常检测和表征的方法的流程图
[0018] 图3B呈现了根据本发明的实施方案的示出用于促进异常检测和表征的方法的流程图。
[0019] 图4A呈现了根据本发明的实施方案的二维数据的示例性历史时间序列分析。
[0020] 图4B呈现了根据本发明的实施方案的图4A的二维数据的导数的示例性历史时间序列分析。
[0021] 图4C呈现了根据本发明的实施方案的从图4B的示例性数据获取的数据的示例性最近时间序列分析,其包括异常的表征。
[0022] 图5呈现了根据本发明的实施方案的示出用于促进异常检测和表征的方法的流程图。
[0023] 图6示出了根据本发明的实施方案的促进异常检测和表征的示例性分布式计算机和通信系统。
[0024] 图7示出了根据本发明的实施方案的促进异常检测和表征的示例性装置。
[0025] 本文所述的实施方案通过提供分析历史数据和最近时间序列数据两者的系统来解决在二维或更高维度数据组中识别和表征异常的问题。
[0026] 能源使用可引起显著的总体系统成本,诸如在运行具有机器的工厂或具有许多机器的数据中心时。随着智能仪表、传感器和物联网(IoT)设备的出现,存在用以监测工厂机器的低效率以及检测和管理异常的能源使用的机会。相关美国专利申请16/143,223涉及一种通过对二维或更高维度数据组的时间序列数据使用历史范围和分箱四分位距分析来促进异常检测的方法。然而,目前无法区分(一方面)减少能量或生产率损失的真正机会与(另一方面)来自快速瞬时事件(例如,电源开/关、突然温度变化和突然的生产水平提高)的不可控的电源浪涌。这可能导致用于数据挖掘和异常检测的系统效率低下。
[0027] 本文所述的实施方案通过使用历史数据/模式(例如,从一组传感器获取)以及将当前能源使用与历史数据/模式(例如,最近时间序列数据分析)相关联而识别和表征二维或更高维度数据组中的异常来解决该问题。例如,系统可将最近时间历史中的各种参数浪涌的已知阈值与和特定机器相关联的给定控制/响应变量的预期能量消耗水平进行组合。
[0028] 如上所述,识别和表征异常可在许多领域(例如,制造、医疗领域和能源相关领域)提供更有效的系统,并且继而可降低成本并且改善系统以及其组成部件或零件的总体效率。本文所述的实施方案提供了一种计算机系统,该计算机系统通过执行历史分析(例如,使用美国专利申请16/143,223中描述的“分箱”IQR分析)并且随后对任何所识别的异常执行最近时间序列分析来提高检测和表征两个或更多个维度或变量的数据序列的异常的效率。
[0029] 此外,在本文所述的实施方案中,系统增强并且改进数据挖掘和异常值检测,其中所述改进从根本上讲是技术性的。通过更有效地识别和表征异常,所述改进可产生更有效的制造系统或其它物理系统。系统管理员或其他用户可基于所识别的异常采取补救或其他动作,以提高制造或其他物理系统的总体效率。
[0030] 因此,本文所述的实施方案向技术问题提供了技术解决方案(对两个或更多个维度上的数据执行联合历史和时间序列分析以便检测和表征异常)(通过允许用户基于检测到的和表征的异常来采取动作从而提高制造或其他物理系统的效率)。例如,用户(或系统)可执行移除或解决异常的动作,或者可执行将一些表征的异常视为比其他表征的异常或多或少更重要的动作,例如通过为某些表征的异常分配权重或优先级。
[0031] 图1示出了根据本发明的实施方案的用于促进异常检测和表征的示例性环境100。环境100可包括:设备102和相关联的用户112;设备104和相关联的用户114;以及设备106。
设备102、104和106可经由网络120彼此通信。环境100可还包括具有传感器的物理对象(一个或多个),该传感器可在一段时间内并且以周期性间隔记录数据。例如,环境100可包括:
房间130,其可包括设备132.1-132.m和传感器134.1-134.n;以及外部温度传感器136。传感器134.1-134.n可监测与房间相关联的物理特征,诸如在房间130中消耗的加热、通空调(HVAC)能量的量或房间130中的特定设备消耗或使用的HVAC能量的量。外部温度传感器
136可以监测室外空气的温度,无论是在同一建筑物内部还是在房间130所在建筑物的外部。
[0032] 又如,传感器134.1可测量由特定设备132.1(例如,压缩机机器)消耗的HVAC能量的量(例如,以千瓦时或kWh为单位),同时传感器134.2可测量由特定设备132.1产生或通过该特定设备132.1行进的材料流的量(例如,以m3为单位)。又如,传感器134.3可测量由特定设备132.2(例如,灌封机)消耗或使用的消耗的HVAC能量(例如,以kWh为单位),同时传感器134.4可测量所产生的单元的数量(例如,以单元为单位)。
[0033] 在操作期间,传感器可将其各自测量的测试数据发送至设备104。例如,设备104可从传感器134.1获取测试数据142,并且可还从传感器136获取测试数据144。在相同或不同的时间,用户112可发送命令以请求与房间130的传感器134.1-134.n以及外部温度传感器136相关的某些测试数据的异常152,这可导致向设备104发送获取测试数据154命令。
[0034] 设备104可获取测试数据142和144,并且可组合测试数据142和144。设备104可经由网络120向设备106发送组合的测试数据146。需注意,测试数据142、测试数据144和组合的测试数据146可为数据序列,其可包括时间序列数据或可覆盖频谱。在接收到请求异常152命令以及组合的测试数据146时,设备106可执行历史分析(功能155),该历史分析通过将组合的测试数据146分成多个bin并且对每个bin中的数据执行IQR分析(功能156)来识别异常。执行“分箱”四分位距(IQR)分析描述于美国专利申请16/143,223中。在IQR分析期间,设备106可识别来自组合的测试数据146的测试数据点(并且具体地讲,来自每个划分的测试数据的bin或组中的测试数据点),所述测试数据点不在由相应bin的下限和上限限定的范围内,其中下限和上限基于IQR分析来确定。
[0035] 在基于IQR分析识别异常之后,设备106可通过从组合的测试数据146获取包括来自最近时间段的数据序列的第二组测试数据来执行最近时间序列分析(功能156)。最近时间段可在当前时间之前小于预先确定的时间段处出现,并且第二组测试数据可包括来自基于IQR分析所识别的异常的第一数据点。
[0036] 作为功能156的一部分,设备106可计算第二组测试数据的导数的量值,并且基于第二组测试数据的导数的量值是否大于第一预先确定的阈值来将第一数据点分类为特定类型的异常。导数的量值和第一预先确定的阈值可以是正数、负数或零。设备106可经由网络120将第二组测试数据中的第一数据点(和其他分类的数据点)的(所述)一个或多个分类158发送回设备102。
[0037] 在接收到一个或多个分类158时,设备102可表征异常(功能160),并且可还执行动作(功能162),该动作可包括基于分类(作为异常)或表征(作为特定类型的异常)来执行预先确定的规则。例如,如果第二组测试数据的导数的量值大于第一预先确定的阈值,则设备102可将第一数据点表征为浪涌异常,该浪涌异常可与电源开/关事件、控制参数的浪涌(诸如功率或测量压力的部件)或控制参数的突然瞬时变化相关。其他类型的异常可与稳态异常相关联(例如,如果第二组测试数据的导数的量值小于第一预先确定的阈值)。此外,预先确定的规则可包括自动调节与参与获取测试数据的传感器或设备相关的物理部件或单元。
[0038] 类似地,用户112可表征异常(功能164),并且可还执行动作(功能166),该动作可包括根据其他历史数据(例如,最近时间历史中的已知浪涌阈值以及与给定机器相关的给定控制或响应变量的预期能量消耗水平)来查看分类的异常。动作166可导致用户112补救或发现分类的异常的原因,此时用户112可采取措施以防止此类异常再次发生。
[0039] 也就是说,一个或多个分类158允许设备102和用户112两者使用以下结果:1)基于对离散的bin或组执行的IQR分析的增强的数据挖掘和异常值检测;以及2)随后的最近时间序列分析。例如,基于对请求异常152命令的响应(即,一个或多个分类158),用户112可表征所识别的(分类的)异常(功能164),并且执行可影响和改善与房间130和房间130中的设备132.1-132.m相关联的制造系统或其他物理系统的操作和性能的动作(功能166)。该动作可以是补救或纠正动作,以确保所分类的异常不再发生。用户112可还监视、观察和分类后续测试数据以确定用户112的动作是否具有预期效果,包括移除或删除任何先前检测到的异常。
[0040] 图2A示出了根据本发明的实施方案的具有示例性测试数据的曲线图200,其包括一段时间内的二维数据组的聚集快照。曲线图200可包括用于灌封机的数据序列(例如,时间序列数据)。曲线图200可包括指示灌封计数(例如,产生或灌封的项目数)的x轴,以及指示灌封机消耗的功率之和(如经由多个传感器以kWh或kW为单位进行测量)的y轴。在曲线图420中,蓝色指示二维测试数据(例如,“第一组测试数据”)。
[0041] 图2B示出了根据本发明的实施方案的图2A的示例性测试数据的曲线图210,其包括对已被分成bin或组的测试数据执行四分位距分析。曲线图210可包括指示灌封计数(例如,产生或灌封的项目数)的x轴,以及指示灌封机消耗的功率之和(如经由多个传感器以kWh或kW为单位进行测量)的y轴。在曲线图210中,竖直红色虚线指示“bin”或组之间的分离。也就是说,系统确定bin的数量n,其可基于例如自动过程、算法、参与获取数据的传感器或机器的分辨率,或与数据相关并且由计算设备或用户获取的历史数据或知识。系统可对每个bin执行IQR分析。在每个bin中,黑色实线指示上限和下限,而绿色“+”符号指示相应bin的中位数。曲线图210中的蓝色指示基于针对相应bin的IQR分析被分类为正常或未被分类为异常的二维数据。曲线图210中的红色指示基于针对相应bin的IQR分析被分类为异常或异常值的二维数据。
[0042] 然而,图2B中的曲线图210中所识别的异常不指示异常的类型。也就是说,系统不表征所识别的异常,例如,与电源浪涌或控制变量的突然瞬时变化相关联。
[0043] 图2C示出了根据本发明的实施方案的从图2A的示例性测试数据获取的数据的曲线图222和232,其包括来自二维数据组的每个变量的最近时间段的时间序列数据以及与电源浪涌相关联的异常的表征。曲线图222包括2016年12月22日的三小时时段的数据(例如,“第二组测试数据”)。功率224的量度以kW为单位,并且以红色显示(如索引中的功率244所指示)。计数226的量度以产生的项目的单位为单位,并且以蓝色显示(如索引中的计数242所指示)。框228可指示与来自图2B的曲线图210的分类的异常相对应的数据。用户(或系统)可对第二组数据执行该最近时间序列分析(在曲线图222中),并且基于第二组测试数据的导数的大小是否大于第一预先确定的阈值来表征先前检测到的和分类的异常。例如,通过观察到功率相对于计数变化的变化高于特定阈值,用户(或系统)可确定这是与该特定时间(例如,约20:00)的电源浪涌相关联的低效异常。
[0044] 类似地,曲线图232包括2017年5月10日的三小时时段的数据(例如,“第二组测试数据”)。功率234的量度以kW为单位,并且以红色显示(如索引中的功率244所指示)。计数236的量度以产生的项目的单位为单位,并且以蓝色显示(如索引中的计数242所指示)。
[0045] 图2D示出了根据本发明的实施方案的基于图2A的示例性测试数据的结果的表250,其包括可被分类为异常的特定数据点的表征或原因。表250可包括但不限于列诸如:索引252;时间254;地点256;机器258;原因260;和量262。在常规系统中,原因260可仅表征为“正常”或“不正常”(或“非异常”或“异常”)。相比之下,在本文所述的实施方案中,原因260可包括异常的更具体的表征。例如,条目264和266指示正kWh量的原因是“过度使用”而不是“使用不足”。因此,原因260可向用户提供更多信息,并且允许用户执行补救或纠正这种异常的动作。
[0046] 图2E示出了根据本发明的实施方案的从图2A的示例性测试数据获取的数据的曲线图272和282,其包括来自二维数据组的每个变量的最近时间段的时间序列数据以及与电源浪涌相关联的异常的表征。曲线图272包括2017年5月13日的24小时时段的数据(例如,“第二组测试数据”)。功率274的量度以kW为单位,并且以红色显示(如索引中的功率294所指示)。计数276的量度以产生的项目的单位为单位,并且以蓝色显示(如索引中的计数292所指示)。框278可指示与来自图2B的曲线图210的分类的异常相对应的数据。用户(或系统)可对第二组数据执行该最近时间序列分析(在曲线图272中),并且基于第二组测试数据的导数的大小是否大于第一预先确定的阈值来表征先前检测到的和分类的异常。例如,通过观察到功率相对于计数变化的变化高于特定阈值,用户(或系统)可确定这是与该特定时间(例如,约6:00)的功率斜线下降相关联的异常。
[0047] 类似地,曲线图282包括2017年1月10日的24小时时段的数据(例如,“第二组测试数据”)。功率284的量度以kW为单位,并且以红色显示(如索引中的功率294所指示)。计数286的量度以产生的项目的单位为单位,并且以蓝色显示(如索引中的计数292所指示)。框
288可指示与来自图2B的曲线图210的分类的异常相对应的数据。用户(或系统)可对第二组数据执行该最近时间序列分析(在曲线图282中),并且基于第二组测试数据的导数的大小是否大于第一预先确定的阈值来表征先前检测到的和分类的异常。例如,通过观察到功率相对于计数变化的变化高于特定阈值,用户(或系统)可确定这是与该特定时间(例如,约6:
00)的功率斜线上升相关联的异常。
[0048] 用户(或系统)可随后使用该数据将特定数据点分类为特定类型的异常,并且可随后执行处理分类的和表征的异常的动作。例如,由于这两个异常被表征为与一天中的相同时间发生的斜线下降或斜线上升过程相关联,因此用户可针对其他天的类似时间段获取适当的数据,尤其是对于在先前的分箱IQR分析(如图2B和图4B)中被分类为异常的那些天。如果约6:00的数据指示类似的斜线上升或斜线下降(由于电源浪涌),则用户可得出结论,与相关房间中的物理设备相关的一些服务器进程或其他操作可能导致这些与电源浪涌相关的异常。然后,用户可执行补救或校正动作以确保所分类(和表征)的异常不再发生。用户可调节影响被测量的变量的物理参数(例如,压缩机流量或压缩机能量),并且可还调节从中获取数据序列的设备的物理部件(例如,压缩机或压缩机上的传感器,其测量并且因此提供数据序列的数据)。作为另外一种选择,在表征与电源浪涌相关的这些异常时,用户可确定不需要采取任何动作,例如,如果电源浪涌以预期时间或间隔发生,诸如在计划的电力循环或系统重启期间。
[0049] 图3A呈现了根据本发明的实施方案的示出用于促进异常检测和表征的方法的流程图300。在操作期间,系统确定第一变量和一个或多个第二变量y和x的数据序列,其中y是异常检测的对象(操作302)。已知第二数据x影响第一数据y的行为。针对第二数据x,系统将数据分成n个bin(操作304)。系统采用第i个bin中的数据的索引(操作306),并且将其传递到下一个操作中。针对第一数据y,该系统确定具有所选择的索引(y|x=xi)的数据(操作312)。系统获取对具有所选择的索引的数据的历史分析(即,对第i个bin中的数据执行IQR分析)(操作314)。基于对所选择的索引(即,对于第i个bin中的数据)的历史分析,系统确定第i个bin中的异常(操作316)。系统还保存所确定的异常。
[0050] 如果没有剩余的bin(即,当前索引i不小于bin的数量n)(决定318),则该操作继续,如下文在图3B的标记A处所述。如果存在剩余的bin(即,当前索引i小于bin的数量n)(决定318),则系统使i递增(通过将i设置为i+1),并且该操作返回到操作306。
[0051] 图3B呈现了根据本发明的实施方案的示出用于促进异常检测和表征的方法的流程图330。系统获取第一变量和一个或多个第二变量y和x的数据序列的最近时间序列分析。如果系统未检测到浪涌(即,如果时间导数的量值不大于第一预先确定的阈值)(决定334),则系统将异常分类为稳态异常(操作336)。
[0052] 如果系统确实检测到浪涌(即,如果时间导数大于第一预先确定的阈值)(决定334),则系统将异常分类为浪涌异常(操作336)。如果系统未检测到持续性或趋势性的高浪涌(决定342),则系统确定与数据序列相关联的机器正在经历正常操作(操作344)。如果系统确实检测到持续性或趋势性的高浪涌(决定342),则系统确定与数据序列相关联的机器正在经历劣化(操作346)。系统可基于参与获取数据序列的物理设备来确定其是否检测到持续性或趋势性的高浪涌,其中趋势大于第二预先确定的阈值。
[0053] 图4A呈现了根据本发明的实施方案的二维数据的示例性历史时间序列分析400。分析400包括曲线图402和曲线图412。曲线图402可包括指示时间(例如,以一个月的间隔标记)的x轴,以及指示压缩机的流量的量度(以m3为单位)的y轴。曲线图412可包括指示时间(例如,以一个月的间隔标记)的x轴,以及指示由压缩机消耗的能量的总和的量度(以kWh为单位)的y轴。曲线图402和412中的蓝色指示每个维度的历史时间序列数据(例如,“第一组测试数据”)。
[0054] 图4B呈现了根据本发明的实施方案的图4A的二维数据的导数的示例性历史时间序列分析420。分析420包括曲线图432和曲线图442。曲线图432指示图4A的曲线图402中的时间序列数据(即,随时间推移的压缩机流量)的导数。曲线图442指示图4A的曲线图412中的时间序列数据(即,随时间推移的压缩机能量)的导数。曲线图432和442中的蓝色指示每个维度的时间序列数据的导数,而红色指示导数中的峰值。系统可通过基于曲线图432和442中的数据执行IQR分析来检查峰值。
[0055] 图4C呈现了根据本发明的实施方案的从图4B的示例性数据获取的数据的示例性最近时间序列分析450,其包括异常的表征。分析450包括曲线图462和曲线图472。曲线图462指示来自图4A和图4B的数据的两个维度中的每一个的数据。具体地,曲线图462包括
2017年4月19日的三小时时段的数据(例如,“第二组测试数据”)。流量466的量度以m3为单位,并且以红色显示(如索引中的流量484所指示)。能量464的量度以kWh为单位,并且以蓝色显示(如索引中的能量482所指示)。类似地,曲线图472包括2016年12月24日的三小时时段的数据(例如,“第二组测试数据”)。流量476的量度以m3为单位,并且以红色显示(如索引中的流量484所指示)。能量474的量度以kWh为单位,并且以蓝色显示(如索引中的能量482所指示)。
[0056] 在检查曲线图432和442中的示例性数据的峰值之后,系统可使用时间序列数据(包括例如显示“高效”使用(如曲线图472所示)和“低效”使用(如曲线图462所示)的时间序列分析)来识别并且进一步表征与功率上/下浪涌相关联的异常。可通过查看与历史或预期使用(例如,在点473、475和477处)相比较的所识别的异常(例如,在点463、465和467处)来识别浪涌。需注意,分析450描绘了对于不同天期间相同的三小时窗口被表征为“高效”或“低效”的数据,但可也包括在不同的窗口、时段或时间间隔内的数据。
[0057] 图5呈现了根据本发明的实施方案的示出用于促进异常检测和表征的方法的流程图500。在操作期间,该系统通过计算设备确定包括多个数据点的第一组测试数据,其中所述第一组包括第一变量和一个或多个第二变量的数据序列,并且其中所述一个或多个第二变量取决于所述第一变量(操作502)。该系统通过将所述第一组数据分成多个组并且对每个相应组中的数据执行四分位距分析来识别异常(操作504)。该系统从所述第一组测试数据获取第二组测试数据,所述第二组测试数据包括来自距当前时间小于预先确定的时间段处出现的最近时间段的数据序列,并且还包括来自所识别的异常的第一数据点(操作506)。该系统基于所述第二组测试数据的导数的量值是否大于第一预先确定的阈值而将所述第一数据点分类为第一类型的异常,从而基于对所述第一组测试数据的历史分析和对所述第二组测试数据的最近时间序列分析来增强所述数据序列的数据挖掘和异常值检测(操作
508)。
[0058] 图6示出了根据本发明的实施方案的促进异常检测和表征的示例性分布式计算机和通信系统。计算机系统602包括处理器604、存储器606和存储设备608。存储器606可包括用作受管存储器的易失性存储器(例如,RAM),并且可用于存储一个或多个存储池。此外,计算机系统602可耦接到显示设备610、键盘616和指向设备616。存储设备608可存储操作系统616、内容处理系统618和数据632。
[0059] 内容处理系统618可包括当由计算机系统602执行时可使得计算机系统602执行本公开所述的方法和/或过程的指令。具体地,内容处理系统618可包括用于通过计算机网络(通信模620)向其他网络节点发送和/或从其他网络节点接收数据包的指令。数据包可包括数据、时间序列数据、数据序列、分类、请求、命令、测试实例和训练实例。
[0060] 内容处理系统618可包括由计算设备确定包括多个数据点的第一组测试数据的指令,其中第一组包括用于第一变量和一个或多个第二变量的数据序列,并且其中一个或多个第二变量依赖于第一变量(通信模块620和数据获取模块622)。内容处理系统618可包括用于通过将第一组测试数据分成多个组并且对每个相应组中的数据执行四分位距分析来识别异常的指令(历史分析执行模块624)。内容处理系统618可还包括用于从所述第一组测试数据获取第二组测试数据的指令,所述第二组测试数据包括来自在当前时间之前小于预先确定的时间段处出现的最近时间段的数据序列,并且还包括来自所识别的异常的第一数据点(最近时间序列分析执行模块626)。内容处理系统618可包括用于基于第二组测试数据的导数的量值是否大于第一预先确定的阈值而将第一数据点分类为第一类型的异常的指令,从而基于对所述第一组测试数据的历史分析和对所述第二组测试数据的最近时间序列分析来增强所述数据序列的数据挖掘和异常值检测(异常表征模块628)。
[0061] 内容处理系统618可另外包括用于由所述计算设备的用户基于一组预先确定的条件将第一数据点分类为第一类型的异常的指令(异常表征模块628)。内容处理系统618可包括用于由计算设备的用户执行处理所分类的异常的动作的指令(动作执行模块630)。
[0062] 数据632可包括作为输入所需要的或作为本公开所述的方法和/或过程的输出而生成的任何数据。具体地,数据632可存储至少:数据;一组测试数据;多个数据点;第一变量;一个或多个第二变量;第一以及一个或多个第二变量的时间序列数据;多个组;时间序列数据的类型;四分位距;测试数据点的分类;被分类为异常的测试数据点;被分类为正常数据点的测试数据点;多个变量的时间序列数据的增强的数据挖掘和异常值检测的指示;动作的指示;补救和纠正动作;异常;分类的异常;异常的表征;预先确定的阈值;数据点或一组数据的导数的量值或导数;影响第一变量或第二变量的物理参数的指示;温度值;用于计量生产的计数、数量或其他单位;材料的流量单位或量度;材料的压力单位或量度;控制参数;可在测量另一个参数时用作控制参数的任何参数;传感器、智能仪表、IoT设备以及可测量参数的任何设备的指示;异常的类型;控制参数的浪涌;开/关事件;控制参数的突然瞬时变化;稳态异常;趋势;高浪涌的指示;物理设备正在经历正常操作的指示;物理设备正在经历劣化的指示;以及从其获取数据序列的设备的物理部件的指示。
[0063] 图7示出了根据本发明的实施方案的促进异常检测和表征的示例性装置。装置700可包括多个单元或装置,多个单元或装置可经由有线、无线、光量子或电通信信道彼此通信。装置700可使用一个或多个集成电路来实现,并且可包括比图7中所示的那些更少或更多的单元或装置。另外,装置700可被集成在计算机系统中,或被实现为能够与其他计算机系统和/或设备通信的独立设备。具体地,装置700可包括单元700至712,这些单元执行类似于图6的计算机系统602的模块620至630的功能或操作,包括:通信单元702;数据获取单元704;历史分析执行单元706;最近时间序列分析执行单元708;异常表征单元710;和动作执行单元712。
[0064] 本具体实施方式中描述的数据结构和代码通常存储在计算机可读存储介质上,该计算机可读存储介质可以是可存储供计算机系统使用的代码和/或数据的任何设备或介质。计算机可读存储介质包括但不限于易失性存储器、非易失性存储器磁性和光学存储设备,诸如磁盘驱动器、磁带、CD(光盘)、DVD(数字通用光盘或数字视频光盘),或能够存储现在已知的或稍后开发的计算机可读介质的其他介质。
[0065] 在具体实施方式部分中描述的方法和过程可实施为代码和/或数据,其可存储在如上所述的计算机可读存储介质中。当计算机系统读取和执行存储在计算机可读存储介质上的代码和/或数据时,计算机系统执行体现为数据结构和代码并且存储在计算机可读存储介质内的方法和过程。
[0066] 此外,上述方法和过程可包括在硬件模块或装置中。硬件模块或装置可包括但不限于专用集成电路(ASIC)芯片、现场可编程阵列(FPGA)、在特定时间执行特定软件模块或一段代码的专用或共享处理器,以及现在已知的或稍后开发的其他可编程逻辑设备。当硬件模块或装置被激活时,它们执行包括在其中的方法和过程。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈