首页 / 专利库 / 资料储存系统 / 数据库 / 数据分类装置

数据分类装置

阅读:377发布:2020-05-08

专利汇可以提供数据分类装置专利检索,专利查询,专利分析的服务。并且本 发明 的目的在于,提供能够减少错误检测的数据分类装置以及异常诊断系统。为了解决上述课题,本发明的数据分类装置具有将运行数据分类为多个类别的数据分类部(30)、以及管理数据分类部的输出的分类结果 数据库 (40),数据分类部(30)优先选择表示生成类别的顺序的代际编号小的上述类别作为类别候补并决定运行数据的类别。,下面是数据分类装置专利的具体信息内容。

1.一种数据分类装置,其具有将运行数据分类为多个类别的数据分类部、以及管理上述数据分类部的输出的分类结果数据库,其特征在于,
上述数据分类部优先选择表示生成上述类别的顺序的代际编号小的上述类别作为类别候补并决定上述运行数据的类别。
2.根据权利要求1所述的数据分类装置,其特征在于,
该数据分类装置判定上述类别候补的适当性,如果适当则将上述类别候补设为上述运行数据的类别,在不适当的情况下不采用上述类别候补。
3.根据权利要求2所述的数据分类装置,其特征在于,
当判定为上述不采用时在存在其他上述类别候补的情况下选择其他上述类别候补,在不存在其他上述类别候补的情况下生成新类别并设为上述类别候补。
4.一种异常诊断系统,其具备权利要求1~3中任意一项所述的数据分类装置,其特征在于,
该诊断系统具备:
设备;
运行数据数据库,其保存上述设备的上述运行数据;以及
显示操作部,其选择上述运行数据中的正常数据。
5.根据权利要求4所述的异常诊断系统,其特征在于,
上述显示操作部设定上述数据分类部的数据分类期间或阈值
6.根据权利要求4所述的异常诊断系统,其特征在于,
上述显示操作部显示上述分类结果数据库的分类结果。

说明书全文

数据分类装置

技术领域

[0001] 本发明涉及数据分类装置以及异常诊断系统。

背景技术

[0002] 在发电成套设备和装置中,以监视以及控制为目的,设置有温度计、压计以及流量计等多个传感器。另外,近年来,在桥梁和道路等基础设备中也设置加速度传感器等传感器,实施监视设备的状态监视。
[0003] 这种传感器数据的特征是具有多个关联的传感器数据,并且是在某个时间周期测量到的多维的时间系列数据。在活用了这种多维的时间系列数据的状态监视方法中提出各种方法。最简单的是选择多维数据项目中的应该着眼的数据项目,根据数据项目的值是否超过预先设定的阈值来检测状态变化的方法。另外,在非专利文献1所示的方法中,将多维数据进行聚类,分割为类别,由此来检测异常。
[0004] 使用图1说明非专利文献1所示的方法。在本现有技术中,使用自适应共振理论(以下称为ART)作为数据聚类技术之一。在ART中,具有根据类似度将多维数据分类为多个类别的功能。在本检测方法中,使用该功能在学习阶段和诊断阶段2个阶段来检测设备的异常。
[0005] 在学习阶段中,将设备为正常状态的运行数据输入给ART。ART根据数据的类似度将运行数据分类为多个类别,因此能够规定在运行数据正常时生成的类别。
[0006] 在诊断阶段中,将想要诊断的运行数据(诊断数据)输入给学习了正常数据的ART。其结果为,与学习数据的类似度高的数据被分类为与学习阶段相同的类别。但是,当设备产生某些异常且数据的倾向改变时,被分类为与学习数据不同的类别(新规类别)。这样,能够根据由ART进行了分类的类别来判定设备的状态变化。
[0007] 现有技术文献
[0008] 非专利文献
[0009] 非专利文献1:日本机器学会杂志Vol.118(2015)No.1163p.624-627
[0010] 非专利文献2:G.A.Carpenter andS.Grossberg:”ART2:Self-OrganizatioNo.f stable category recognition codes for analog input patterns”,Applied Optics,Vol26,No.23,(1987)

发明内容

[0011] 发明要解决的课题
[0012] 但是,在非专利文献1记载的技术中,会有已被分类为正常数据的数据的一部分被分类为新类别的情况。使用图2、图3说明该例子。
[0013] 图2是示意地表示学习数据的分类结果的图。由实践包围的部分表示学习时的类别的区域。图3示意地示出了在学习时的类别区域的附近输入数据m而生成新类别时的分类结果。如本图所示,当在学习数据的附近生成新类别时,被分类为学习时的类别的数据k会被分类为新类别。在ART中,由于任意类别的区域都进入的数据被分类为更近的类别,因此通过新类别的产生位置会产生上述现象。即,由于新类别的产生,数据分类特性会发生变化,因此没有考虑检测精度
[0014] 用于解决课题的方案
[0015] 如要表示本发明代表性的内容之一,则为一种数据分类装置,其具有将运行数据分类为多个类别的数据分类部、以及管理上述数据分类部的输出的分类结果数据库,其中,上述数据分类部优先选择表示生成上述类别的顺序的代际编号小的上述类别作为类别候补并决定上述运行数据的类别。
[0016] 发明的效果
[0017] 根据本发明,可以提供能够降低错误检测的数据分类装置以及异常诊断系统。附图说明
[0018] 图1是表示非专利文献1所示的方法中将数据分类的想法的图。
[0019] 图2是表示非专利文献1所示的方法中学习了正常数据的例子的图。
[0020] 图3是表示非专利文献1所示的方法中诊断了数据的例子的图。
[0021] 图4是表示本发明第一实施例的结构的图。
[0022] 图5是表示存储在运行数据数据库中的运行数据的例子的图。
[0023] 图6是表示本发明实施例的数据分类部的结构的图。
[0024] 图7是表示类别的代际编号的想法的图。
[0025] 图8是表示本发明实施例的数据分类算法的图。
[0026] 图9是表示在本发明的实施例表示的方法中诊断了数据的例子的图。
[0027] 图10是表示本发明实施例的分类结果数据库所记录的运行数据的一例的图。
[0028] 图11是表示本发明实施例的分类结果数据库所记录的代际编号的一例的图。
[0029] 图12是表示本发明实施例的显示操作部的条件设定画面的一例的图。
[0030] 图13是表示本发明实施例的显示操作部的分类结果显示画面的一例的图。

具体实施方式

[0031] 以下,参照附图说明本发明的实施方式。
[0032] 实施例1
[0033] 图4表示本发明实施方式的第一实施例。本实施例是将本发明的数据分类装置用于成套设备的异常诊断系统的例子,由成套设备10、运行数据数据库20、数据分类部30、分类结果数据库40以及显示操作部50组成。以下描述各个结构要素的概要。
[0034] 成套设备10中设置有流量计、温度计、压力计等传感器,用于设备的控制以及监视。
[0035] 运行数据数据库20中保存通过成套设备10的传感器测量到的数据作为每一分钟的时间系列数据。在被保存的运行数据中通过显示操作部50指定的正常数据被剪切为训练数据,发送给数据学习部30。另外,在通过成套设备实时测量到的数据也被暂时存储到运行数据数据库后,作为诊断数据以固定的周期发送给数据分类部30。
[0036] 在数据分类部30中,使用将自适应共振理论(ART:Adaptive Resonance Theory)作为基础的聚类算法(以下称为改良ART),将多维运行数据分类为多个类别。在改良ART中,除了对所输入的多维数据进行分类的类别编号,还输出表示该类别编号的生成顺序的代际编号。另外,在分类数据时,考虑代际编号来决定类别编号。另外,后面描述决定类别编号的详细算法。
[0037] 在分类结果数据库40中,管理从数据分类部30输出的类别编号和各个类别的代际编号。
[0038] 在显示操作部50中,如上述那样设定学习数据、诊断数据的条件。另外,显示图1下部所示的类别编号的趋势图和诊断结果。
[0039] 接着,详细说明本实施例。
[0040] 成套设备10由机器和将其连接的管道、等构成。为了监视以及控制成套设备的状态,在机器和管道中设置流量计、温度计、压力计等传感器。这些传感器中,例如如果是温度计则带有TIC001的标记。这些标记成为各个传感器的ID,通过标记信息识别各个传感器。
[0041] 在运行数据数据库20中记录通过成套设备10的传感器测量到的数据作为时间系列数据。图5表示运行数据的一例。如图1所示,按照时间保存设置在成套设备10上的传感器数据。该时间间隔能够任意指定,但是在本实施例中,将时间间隔设为1分钟。
[0042] 在数据分类部30中,使用将自适应共振理论(ART)作为基础的改良ART来对数据进行分类。图6表示数据分类部30的详细结构。数据分类部30由数据预处理部31和改良ART32组成。
[0043] 在数据预处理部31中,将运行数据标准化为[0.1]的范围,并追加候补数。具体地说,如果设为有n维的运行数据xi(i=1,2,......n),则首先生成以公式(1)进行标准化而得的数据Xi(i=1,2,......n)。
[0044] Xi=(xi-xi_lower)/(xi_Upper-xi_lower)......(1)
[0045] 这里,xi_Upper是标准化的上限值,xi_lower是下限值。
[0046] 接着,通过公式(2)求出Xi的补充数Xci,设为2n维的数据。
[0047] Xci=1-Xi......(2)
[0048] 这样,将n维的数据设为2n维的预处理是通过ART对数据进行分类时需要的预处理。理由记载在非专利文献2中,因此这里省略说明。
[0049] 接着,说明改良ART32。图6所示的改良ART的结构与现有的ART的结构相同,但是在活用保存在分类结果数据库40中的代际编号并选择类别的方面是不同的点。因此,首先在表示了现有的ART的算法概要之后说明改良点。
[0050] 在F0层,将输入数据向量的大小设为1,去除噪音。在F1层,保持被去除了噪音的输入数据作为短期存储。在F2层,从按照每个类别定义的加权系数和在F1层保持的输入数据中选择与输入数据最一致的类别。在选择子系统中,判定在F2层选择出的类别是否合适,如果合适,则采用选择出的类别作为输出类别。如果不合适,则判断为不采用选择出的类别,并将重置信号发送给F2层。通过重复该处理来选择适当的类别,但是在没有采用所有的类别时,生成新类别。
[0051] 接着,详细说明改良点。首先,说明通过本算法使用的代际编号。代际编号是作为表示生成类别的顺序的编号而新定义的编号。使用图7说明代际编号的具体例子。本图是通过学习数据进行学习后,按照顺序诊断了诊断数据1~诊断数据4的情况下的类别编号的趋势数据。通过学习数据生成的类别0和类别1是最早生成的类别,成为代际编号0。接着,输入诊断数据而新生成的类别2成为代际编号1,通过诊断数据3新生成的类别3以及类别4成为代际编号2。
[0052] 接着,说明使用了代际编号的改良算法的处理。改良算法中,当在F2层选择类别的候补时,优先选择代际编号小的候补。即,首先,在代际编号0即学习时的类别中选择候补,并判断为所有的代际编号0的类别都不适当时,选择代际编号1的类别作为候补。进一步地,当判断代际编号1的类别全部不适当时,选择代际编号2的类别作为候补。最终在判断所有的类别不适当时,追加新的类别。
[0053] 图8表示该算法的详细内容。在步骤321中,输入成为对象的输入数据,在F0层、F1层进行处理。另外,将变量GN设定为初始值(0)。在步骤322中,在F2层中,从代际编号为GN的类别选择最适当的候补类别作为对象数据的类别。步骤323在选择子系统中,判定选择出的候补类别是否适当。如果适当,则进入步骤329,输出选择出的类别。如果不适当,则进入步骤324。步骤324不采用选择出的候补类别。另外,不采用的类别相对于成为对象的输入数据不会再次成为候补。步骤325代际编号是GN,判定是否剩余没有成为不采用的类别。如果有剩余,返回步骤322,再次选择候补的类别。如果没有剩余,进入步骤326。步骤326判定GN是否成为代际编号的最大值。如果没有成为最大值,则进入步骤327,如果成为最大值,则进入步骤328。步骤327使GN的值增加1,进入步骤322的处理。通过该处理从代际编号为1的大的类别中再次选择候补类别。步骤328根据步骤326的结果,针对所有的代际编号而不采用候补类别,因此生成新类别,并作为候补类别,进入步骤329。步骤329输出选择出的候补类别。
[0054] 图9表示使用本算法将数据分类的例子。分类后的数据与图3所示的数据相同。根据图9,通过现有的算法被分类为类别3的数据k在本算法中被分类为类别2。即,通过作为这种算法,能够防止被用作学习数据的数据被分类为正常数据。
[0055] 接着,说明分类结果数据库40。图10和图11表示分类结果数据库的一例。图10记录进行了标准化的运行数据和将运行数据进行了分类的类别编号。例如FIC001被标准化为标准化的上限值为4.0、下限值为3.0。另外,在附加的例子中知道从10点1分到10点3分的数据被全部分类为类别2。
[0056] 图11记录了类别相关的信息。在本实施例中,记录各个类别的代际编号和属性。代际编号如上所述表示类别的产生顺序。本图对应于图7的结果,对学习数据进行了分类的类别1、2的代际编号记录为0,将在将诊断数据1分类时输出的类别3的代际编号记录为1。另外,属性是记录产生了各个类别时的成套设备的状态的属性,如果需要是用户能够输入的项目。在图11的例子中,在产生了类别编号4、5时,在机器的压力中发现异常,因此登记为“压力异常”。
[0057] 最后,说明显示/操作部50。在显示/操作部50中,如上述那样设定学习数据、诊断数据的条件,显示分类结果。
[0058] 图12表示条件设定画面的一例。在图12的上部,通过期间和条件来设定学习数据的条件。在期间中,指定开始时刻和结束时刻,并提取其中包括的数据。在图12的例子中,将从2016/9/1的0时到2016/12/1的0时为止的三个月和从2017/1/1的0时到2017/3/1的0时为止的2个月合计5个月的期间设定为学习期间。但是,没有全部使用该期间包括的数据,在“条件”栏指定所使用的数据的条件。这里,只将与条件1:FIC002的值为2.5以上、条件2:FIC003的值为3.5以上这2个条件的AND(与)条件一致的数据用作学习数据。另外,在本实施例中,示出了指定条件1和条件2的AND(与)条件的例子,但是,将复合条件部分的数式设为1+2,由此也能够指定OR(或)条件。通过设定这样的条件,例如对成套设备的原料供给量为一定值以上,从而能够只提取稳定运转的数据。
[0059] 接着,说明位于图12下部的诊断数据的设定画面。诊断时,以固定的诊断周期来诊断数据,因此在设定画面中设定诊断周期。根据数据的时刻数据自动判定采样周期。在本实施例中,示出了采样周期为1分钟的例子。诊断周期设定采样周期的N倍(N=1,2,......)的值。在本实施例中,设为N=10,以10分钟间隔进行诊断。即,每10分钟汇总10个的1分钟的数据并输入给数据分类部50,判定10个数据的类别。
[0060] 图13是显示操作部50的分类结果显示画面的例子。这里,在上部显示运行数据的趋势图,在下部示出与趋势图相同期间的类别编号的推移。在通过该结果图表的显示,产生新类别,并检测出异常时,能够相匹配地确认运行数据的变化。在本实施例中,可知类别编号3以上是新类别,在产生新规类别时PIC001的值变大。
[0061] 以上,通过使用本发明的数据分类装置,能够防止用作学习数据的数据被分类为正常数据。另外,在将多维的时间系列数据的状态进行分类时,提高过去的数据分类结果的再现性。
[0062] 附图标记的说明
[0063] 10:成套设备、20:运行数据数据库、30:数据分类部、40:分类结果数据库、50:显示操作部。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈