首页 / 专利库 / 人工智能 / 莱文斯坦距离 / 处理自动化系统的日志文件的方法及其应用和自动化系统

处理自动化系统的日志文件的方法及其应用和自动化系统

阅读:865发布:2020-05-19

专利汇可以提供处理自动化系统的日志文件的方法及其应用和自动化系统专利检索,专利查询,专利分析的服务。并且本 发明 涉及一种用于自动地处理技术设备的自动化系统(1)的多个日志文件(P1至Pn)的方法,该方法包括如下步骤:通过将日志文件(P1至Pn)的相应的数据组(D1至Dn)的全部内容链接来确定日志文件(P1至Pn)的每个数据组(D1至Dn)的至少一个消息部分(N1至Nn),将全部日志文件(P1至Pn)的数据组(D1至Dn)在总文件(SD)中组合,将全部日志文件(P1至Pn)的数据组(D1至Dn)在总文件(SD)中以时间顺序排序,压缩在总文件(SD)中的每个数据组(D1至Dn),通过一个或多个数字的代码(Kx)将总文件(SD)中的压缩的数据组(D1至Dn)编码,根据确定的数字的代码(Kx)将压缩的数据组(D1至Dn)排序和并分配至至少一个具有对应的组码(KGy)的组(Gy),并且通过对分配的组(Gy)的组码(KGy)解码来输出日志文件(P1至Pn)的字母数字的消息部分(N1至Nn),并且输出解码的组码(KGy)。,下面是处理自动化系统的日志文件的方法及其应用和自动化系统专利的具体信息内容。

1.一种用于对技术设备的自动化系统(1)的多个不同类型的日志文件自动地进行处理的方法,所述方法包括以下步骤:
-通过如下方式确定所述日志文件的每个数据组的至少一个消息部分,
-该方式将所述日志文件的相应的所述数据组的全部的内容链接,
-将全部所述日志文件的所述数据组在总文件中组合,
-在所述总文件中将全部所述日志文件的所述数据组以时间顺序进行排序,-压缩在所述总文件中的每个所述数据组,
-通过至少一个或多个数字的、字母的或字母数字的代码对在所述总文件中的压缩的所述数据组进行编码,
-根据确定的数字的、字母的或字母数字的所述代码将压缩的所述数据组排序并分配至至少一个具有对应的组码的组,并且
-对分配的所述组的所述组码进行解码,并且将解码的所述组码输出作为所述日志文件的字母数字的消息部分,并且
-将所述日志文件的字母数字的消息部分存储在存储器(10)中。
2.根据权利要求1所述的方法,其中,在压缩所述数据组时,通过至少减少相应的所述数据组的数据长度和/或数据内容的方式来处理所述数据组。
3.根据权利要求2所述的方法,其中,对于包含在所述数据组中的特殊字符而言自动地使用空白字符,并且在由此得到至少两个或更多个彼此相随的空白字符的情况下,将数量超出一个单独空白字符的彼此相随的空白字符从所述数据组中移除。
4.根据权利要求1至3中任一项所述的方法,其中,解除相应的所述数据组的所述内容的链接,并且将具有小于四个字符的、由此得出的单独的字母数字的内容移除。
5.根据权利要求4所述的方法,其中,通过将参考字分配给每个单独的字母数字的所述内容并且将数字的所述代码分配给每个所述参考字的方式,分析和统一单独的字母数字的所述内容。
6.根据权利要求5所述的方法,其中,根据确定的所述参考字和/或数字的所述代码,将具有单独的字母数字的所述内容的所述总文件转换成二维的代码矩阵。
7.根据权利要求6所述的方法,其中,二维的所述代码矩阵是字母数字的代码矩阵。
8.根据权利要求6所述的方法,其中,以时间顺序和/或取决于相应的字符长度地对二维的所述代码矩阵的数字的所述代码进行排序。
9.根据权利要求7所述的方法,其中,以时间顺序和/或取决于相应的字符长度地对二维的所述代码矩阵的数字的所述代码进行排序。
10.根据权利要求6所述的方法,其中,借助于相似性运算对所述代码矩阵的相似的数字的代码进行分组。
11.根据权利要求9所述的方法,其中,借助于相似性运算对所述代码矩阵的相似的数字的代码进行分组。
12.根据权利要求11所述的方法,其中,借助于莱文斯坦距离对所述代码矩阵的相似的数字的代码进行分组。
13.根据权利要求10所述的方法,其中,在待考虑的数字的所述代码到所述组中的一个组的莱文斯坦距离为零的情况下,将该待考虑的数字的所述代码分配给该一个组。
14.根据权利要求12所述的方法,其中,在待考虑的数字的所述代码到所述组中的一个组的莱文斯坦距离为零的情况下,将该待考虑的数字的所述代码分配给该一个组。
15.根据权利要求10所述的方法,其中,在待考虑的数字的所述代码到所述组中的一个组的莱文斯坦距离为一的情况下,并且在待考虑的数字的所述代码与所述组中的至少一个组仅在一位处不相同的情况下,将该待考虑的数字的所述代码分配给该至少一个组。
16.根据权利要求14所述的方法,其中,在待考虑的数字的所述代码到所述组中的一个组的莱文斯坦距离为一的情况下,并且在待考虑的数字的所述代码与所述组中的至少一个组仅在一位处不相同的情况下,将该待考虑的数字的所述代码分配给该至少一个组。
17.根据权利要求1至3中任一项所述的方法,其中,将每个新的待考虑的数字的所述代码与相同长度的未分组的数字的所述代码比较,或与具有长出最多一个字符的更长的长度的、未分组的数字的所述代码比较。
18.根据权利要求16所述的方法,其中,将每个新的待考虑的数字的所述代码与相同长度的未分组的数字的所述代码比较,或与具有长出最多一个字符的更长的长度的、未分组的数字的所述代码比较。
19.根据权利要求17所述的方法,其中,当待考虑的数字的所述代码到另外的未分组的数字的所述代码的莱文斯坦距离等于一时,就由这两个数字的所述代码通过如下的方式形成新的组,即
-在待考虑的这两个数字的所述代码的长度不同的情况下,将较短的数字的所述代码分配给所述新的组,或者
-在具有至少一个不同字符的这两个数字的所述代码的长度相同的情况下,将没有所述不同字符的数字的所述代码分配给所述新的组。
20.根据权利要求18所述的方法,其中,当待考虑的数字的所述代码到另外的未分组的数字的所述代码的莱文斯坦距离等于一时,就由这两个数字的所述代码通过如下的方式形成新的组,即
-在待考虑的这两个数字的所述代码的长度不同的情况下,将较短的数字的所述代码分配给所述新的组,或者
-在具有至少一个不同字符的这两个数字的所述代码的长度相同的情况下,将没有所述不同字符的数字的所述代码分配给所述新的组。
21.根据权利要求1至3中任一项所述的方法,其中,当到另外的未分组的数字的所述代码的莱文斯坦距离不等于一的、待考虑的数字的所述代码被识别出时,将该待考虑的数字的所述代码分配给新的组。
22.根据权利要求20所述的方法,其中,当到另外的未分组的数字的所述代码的莱文斯坦距离不等于一的、待考虑的数字的所述代码被识别出时,将该待考虑的数字的所述代码分配给新的组。
23.一种根据权利要求1至22中任一项所述的方法的应用,所述应用用在技术设备的自动化系统(1)中。
24.一种技术设备的自动化系统(1),所述自动化系统包括彼此经由通信系统连接的至少一个操作和观察层、自动化层和现场层,其中,在所述操作和观察层、所述自动化层和所述现场层中的至少一个中实施根据权利要求1至22中任一项所述的方法。

说明书全文

处理自动化系统的日志文件的方法及其应用和自动化系统

技术领域

[0001] 本发明涉及一种用于自动地处理技术设备、如发电厂设备的自动化系统的多个日志文件的方法。本发明还涉及处理自动化系统的日志文件的方法的应用和自动化系统。

背景技术

[0002] 大型技术设备、如蒸汽和燃气涡轮机设备、化学设备、厂、轧钢厂是复杂的技术系统,其具有多个(例如数百个)部件,如传感器、执行器、驱动器等,所述部件中的每个必要时每秒检测和提供多个测量值,以进行继续处理和传输。
[0003] 为了监视和控制技术设备的部件,如涡轮机蒸发器、发电机、传感器、驱动器、执行器,处理、分析和解析由部件获得的数据。因此可行的是,尽可能早地识别与预设的标准状态的偏差,并且必要时防止部件、如涡轮机的损坏和/或失效。
[0004] 在此,要评估的数据/测量信号的量以及数据/测量信号之间的可能的相关性的复杂度通常比由操作人员对数据/测量信号进行的有效的分析可能要大得多的。
[0005] 在此,技术设备为了对设备进行控制和监视而包括自动化系统,所述自动化系统通常划分成操作和观测层、自动化/处理层和现场层,所述层经由通信单元、尤其一个或多个数据总线系统彼此连接。
[0006] 各个部件、如传感器、执行器、驱动器、涡轮机、自动化单元等的数据、如测量信号、状态信号通常组合到日志文件中,所述日志文件描述一个或多个部件和/或部件组的一个或多个出现的事件,并且传递给技术设备的相关的部件。
[0007] 在自动化的控制和/或监视的实践中,在技术设备中出现事件的情况下,例如在出现干扰情况时,存在生成的日志文件的数量增加的问题。对此的典型的原因例如是传感器故障和/或设备部件故障,其提供附加的测量值进而提供附加的日志文件。这使得生成的日志文件的简明性和可检测性对于操作人员来说变差。此外,对于操作人员困难的是,正确地评估出现的事件。
[0008] 此外,生成多个不同类型的日志文件,所述日志文件的内容不兼容并且不能够比较。

发明内容

[0009] 本发明的目的在于,提供用于自动地处理技术设备的自动化系统的多个日志文件的简单的方法。
[0010] 用于自动地处理、尤其预处理技术设备的自动化系统的多个生成的、尤其不同的和/或不兼容的日志文件的根据本发明的方法至少包括如下步骤:
[0011] -通过如下方式确定日志文件的每个数据组的至少一个消息部分,
[0012] -该方式将日志文件的相应的数据组的全部的内容链接,
[0013] -将全部日志文件的数据组在总文件中组合,
[0014] -在总文件中将全部日志文件的数据组以时间顺序排序,
[0015] -压缩在总文件中的每个数据组,
[0016] -通过至少一个或多个数字的代码对在总文件中的压缩的数据组进行编码,[0017] -根据确定的数字的代码将压缩的数据组排序和/或分配(尤其分组)至至少一个具有对应的组码的组,并且
[0018] -通过对分配的组的组码进行解码来输出日志文件的字母数字(alphanumerisch)的消息部分,并且输出解码的组码。
[0019] 借助于根据本发明的方法实现的是,不同类型的日志文件由于通过编码和分组将其内容统一而能够相互比较并且是兼容的。由此,不同类型的日志文件的统一的和分组的内容能够被简单地且明显更快地进一步处理,尤其用于进一步的自动分析。
[0020] 一个实施方式提出,在压缩数据组时,通过至少减少相应的数据组的数据内容和/或数据长度的方式来处理数据组。
[0021] 例如,对于包含在数据组中的特殊字符或非数字的或非字母的字符而言自动地使用空白字符,其中,在由此得到两个或更多个彼此相随的空白字符的情况下,将数量超出一个单独空白字符的彼此相随的空白字符从数据组中移除。由此,将日志文件的消息部分(例如文本部分、报文部分、状态部分)中的每个字符、例如“*”、“+”、“§”、“#”等从该消息部分中移除,进而从日志文件的系统部分(例如系统时间、版本、补丁)中提取消息部分。因此日志文件的分析被限制于内容相关的消息部分,并因此被显著地简化和加速
[0022] 此外,解除相应的数据组的内容的链接,从而使得内容再次分离。在此特别地,内容以字来分解。具有小于四个字符的、从解除链接中得出的单独的字母数字的内容、尤其是字被移除,以降低要继续处理的字符/数据并因此进行数据压缩。具有小于四个字符的字在分析时可被忽略,因为所述字对于随后的相似性计算而言仅描述“统计噪声”并因此是不重要的。
[0023] 一个编码的可行的实施方式提出,通过将参考字分配给每个单独的字母数字的内容并且将数字的代码分配给每个参考字的方式,分析和统一数据组,尤其是数据组的单独的字母数字的内容。替代数字的代码,能够应用字母的代码和/或字母数字的代码。数字的代码具有简单和快速排序并分组日志文件的数据组的优点。
[0024] 为了进一步统一和压缩不同的日志文件的数据组并且简单和快速地分析数据组,根据确定的参考字和/或数字的代码,将具有全部日志文件的单独的字母数字的内容的总文件转换成二维的、尤其字母数字的代码矩阵。
[0025] 在一个尤其简单的实施方式中,以时间顺序和/或取决于相应的字符长度地对二维的代码矩阵的数字的代码进行排序。在此,借助于相似性运算、尤其所谓的莱文斯坦距离(Levenshtein-Distanz)将代码矩阵的相似的数字的代码分组,尤其分配给至少一个组。在此,每个组通过对应的组码来描述或表示。
[0026] 因此,在待考虑的数字的代码到这些组中的一个组的莱文斯坦距离为零的情况下,将该待考虑的数字的代码分配给这一个组,因为待考虑的数字的代码与该组、尤其与代表该组的组码相同。
[0027] 相反,在待考虑的数字的代码到这些组中的一个组的莱文斯坦距离为一的情况下,并且在待考虑的数字的代码与这一个组仅在一位处不相同的情况下,将该待考虑的数字的代码分配给这一个组。
[0028] 此外,将每个新的待考虑的数字的代码与相同长度的未分组的数字的代码比较,或与具有长出最多一个字符的更长的长度的、未分组的数字的代码比较。
[0029] 对于新的待考虑的数字的代码到另外的未分组的数字的代码的莱文斯坦距离等于一的情况,就由这两个数字的代码通过如下的方式形成具有新的组码的新的组,即[0030] -在待考虑的这两个数字的代码的长度不同的情况下,将较短的数字的代码作为新的组码分配给新的组,或者
[0031] -在具有至少一个不同字符的这两个数字的代码的长度相同的情况下,将没有不同字符的数字的代码作为新的组码分配给新的组。
[0032] 附加地或替选地,当到另外的未分组的数字的代码的莱文斯坦距离不等于一的、新的待考虑的数字的代码被识别出时,将该待考虑的数字的代码分配给另外的新的组。在此,将新的该待考虑的数字的代码作为新的组码分配给该另外的新的组。将在与该新的组码比较时具有为一的莱文斯坦距离的、未来的新的待考虑的数字的代码分配给该新的组。
[0033] 因此,为了将描述事件的、相似的和/或相同的数字的代码分组,通过添加另外的/新的日志文件的新数据组的新数字的代码的方式,连续地扩展和补充确定的二维的代码矩阵和具有组码的确定的组到专家系统(Expertensystem)的特性中。
[0034] 此外,该方法允许的是,在开始该方法时仅使用一定预设的数量的组,并且不生成新的组。由此,首先实现对新的待考虑的数字的代码进行粗略分组。在继续运行中,然后能够允许生成新的组。
[0035] 所述的方法的特征在于,对不同类型的日志文件的、原始不兼容的且不可比较的消息部分通过如下方式相对于常规的分析方法显著更快速地进行排序和分析,即将全部组成部分以原始状态进行链接并且随后通过减少字符来压缩该组成部分,并且对该减少的字符链进行编码,以及将类似的和/或相同的编码的字符链进行分组。
[0036] 优选地,将该方法应用在技术设备、如发电厂设备的自动化系统中。
[0037] 在一个简单的实施方式中,在技术设备的自动化系统的部件中执行根据本发明的方法,其中,自动化系统包括至少一个操作和观察层、自动化/处理层和现场层,所述层经由通信系统彼此连接。
[0038] 本发明还提出根据本发明的方法的应用,该应用用在技术设备的自动化系统中。
[0039] 此外,本发明提出一种技术设备的自动化系统,该自动化系统包括彼此经由通信系统连接的至少一个操作和观察层、自动化层和现场层,其中,在操作和观察层、自动化层和现场层中的至少一个中实施本发明的方法。附图说明
[0040] 本发明的上述的特性、特征和优点以及如何实现其的方式和方法结合实施例的下面的描述变得更加清楚易懂,所述实施例结合附图详细阐明。在此示出:
[0041] 图1示意性地示出用于控制和监视技术设备的自动化系统的实施例,和
[0042] 图2示意性地示出用于处理在自动化系统中生成的日志文件的方法的实施例。

具体实施方式

[0043] 彼此对应的部件在全部附图中设有相同的附图标记。
[0044] 图1示意性地示出用于技术设备、如发电厂设备或化学设备的自动化系统1的实施例的方框图
[0045] 自动化系统1在处理层AS(也称作自动化层)中包括多个自动化设备2,所述自动化设备经由共同的数据总线3彼此连接和通信,并且与操作和观察层BB中的管理单元4连接和通信。此外,自动化设备2经由现场总线5与现场层FE中的现场设备6连接并彼此通信。
[0046] 数据总线3例如能够是以太网总线或其他适当的数据传输单元。现场总线5例如能够是基于以太网的现场总线5或者以无线或有线连接的方式构成为其他适当的数据传输单元。数据总线3和/或现场总线5在此能够形成计算机网络
[0047] 自动化设备2能够不仅由可自由编程的还由存储器可编程的处理器、尤其是处理器单元来构成,并且控制、调节和/或监视技术设备的各个设备部件的相应多个部件组7或子系统。特别地,技术设备的控制、调节和/或监视也包括对数据、例如测量信号、控制信号、输入和输出信号、中间信号、存储的数据、处理数据进行分析和其他的处理。
[0048] 管理单元4能够是数据处理单元、例如个人计算机或其他适当的操作和观察单元,借助于其来监视和控制技术设备。
[0049] 现场设备6例如能够是紧凑的、可自由编程的或存储器可编程的控制装置、尤其是处理器单元和/或至少一个部分固定布线的或逻辑的电路装置,其控制、调节和/或监视设备构件的各个部件8、例如测量探头(传感器)和/或调节机构(执行器),并且经由现场总线5连接以与自动化设备2(也称作控制设备)通信。
[0050] 在技术设备、如发电厂设备运行时,经由数据总线3和现场总线5移动以日志文件P1至Pn形式存在的大的数据量,所述日志文件包括控制命令、状态报告和/或干扰报告,其在管理单元4中通过控制器干预来触发,或者在管理单元4的显示屏或其他可视仪器上进行操作。在此,尤其在设备投入使用时和/或启动/关闭时,需要大量的控制器干预,所述控制器干预相应地产生大量要观察的反馈报告。这导致操作人员的显著负担。
[0051] 图2示意性地示出用于处理、尤其预处理日志文件P1至Pn的方法的实施例,所述日志文件在自动化系统1中生成,并且经由数据总线3和/或现场总线5传输,并且在自动化系统1的单元之间、尤其在管理单元4、自动化设备2和现场设备6之间进行交换。
[0052] 日志文件P1至Pn分别包括至少一个检测时间戳和文本、尤其是消息、通知、状态文本,其描述至少一个事件。附加地,日志文件P1至Pn能够包括系统时间、版本/补丁号和其他信息作为文本。在此,例如多个日志文件P1至Pn描述一个或多个事件。在技术设备的自动化系统1中,例如产生和生成不同的*log-、*xml-、*txt-、*nfo-和/或*dmp-文件作为日志文件P1至Pn。
[0053] 在自动化系统1的部件的至少一个中,特别地执行计算机程序产品,所述计算机程序产品能直接地装载到数字计算机、如管理单元4的存储器中,所述计算机程序产品包括程序代码部分,所述程序代码部分适合于执行下面描述的方法的步骤。替选地,计算机程序产品也能够装载到自动化设备2中。
[0054] 替选地,能够提出计算机可读的程序介质,例如任意的存储器,其包括可由计算机、如管理单元4执行的指令(例如以程序代码的形式),所述指令适合用于使得管理单元4执行下面描述的方法步骤。
[0055] 作为日志压缩器9执行的、用于对所生成的、尤其不同的或不兼容的多个日志文件P1至Pn自动地进行处理、尤其预处理的方法至少包括如下步骤:
[0056] -通过如下方式确定日志文件P1至Pn的每个数据组D1至Dn的至少一个消息部分N1至Nn,
[0057] -该方式将日志文件P1至Pn的相应的数据组D1至Dn的全部内容链接,
[0058] -将全部日志文件P1至Pn的数据组D1至Dn在总文件SD中组合,
[0059] -在数据SD中将全部日志文件P1至Pn的数据组D1至Dn以时间顺序进行排序,[0060] -压缩在总文件SD中的每个数据组D1至Dn,
[0061] -通过至少一个或多个数字的代码Kx对总文件SD中的压缩的数据组kD1至kDn进行编码,
[0062] -根据确定的数字的代码Kx将压缩的数据组kD1至kDn排序和/或分配、尤其分组至至少一个具有对应的组码KGy的组Gy,并且
[0063] -通过对所分配的组Gy的组码KGy解码来输出日志文件P1至Pn的字母数字的消息部分N1至Nn,并且输出解码的组码KGy。
[0064] 日志文件P1至Pn的每个数据组D1至Dn的消息部分N1至Nn例如包括文本消息,如报告、状态、文本、信息、警告等。相应的数据组D1至Dn例如能够具有表格或数据库的形式或具有现场细分的其他适当的形式。
[0065] 相应的日志文件P1至Pn的消息部分N1至Nn例如能够包含在对应的数据组D1至Dn的一个或多个区域中。数据组D1至Dn的其他的区域包含协议信息和/或系统信息、例如系统时间、版本号、补丁号等等。
[0066] 根据本发明的方法提出,每个日志文件P1至Pn的相应的数据组D1至Dn的区域的内容在第一步骤中彼此链接,并且随后将全部日志文件P1至Pn的全部链接的数据组D1至Dn在总文件SD中组合,尤其是数据库或单独的表格。例如,两个日志文件P1和P2包括如下内容或条目:
[0067] 日志文件P1:
[0068] 28.03.2014  ABC
[0069] 21.03.2014  ZDF
[0070] 日志文件P2:
[0071] 27.03.2014  XYZ
[0072] 01.01.2014  SAP
[0073] 在将内容链接和组合到总文件SD中之后,所述总文件包含如下内容:
[0074] 28.03.2014  ABC
[0075] 27.03.2014  XYZ
[0076] 21.03.2014  ZDF
[0077] 01.01.2014  SAP。
[0078] 在该特别的表格式的总文件SD中,具有链接的内容的数据组D1至Dn根据分别对应的时间戳进行排序,尤其以时间顺序排序,例如以上升或下降的顺序排序。
[0079] 对应的时间戳尤其能够是用于所基于的消息的检测时间戳,所述消息尤其描述技术设备中的事件,如“允许范围中的环境温度”、“激活首次启动”、“失效”、“涡轮机启动”等。替选地或附加地,数据组D1至Dn能够根据替选的或附加的日志参数、如检测地点、检测类型和/或检测时间段来排序。
[0080] 在随后压缩具有链接的内容的数据组D1至Dn时,通过至少减少相应的数据组D1至Dn的数据长度和/或数据内容的方式来处理数据组。
[0081] 例如,对于包含在数据组D1至Dn中的特殊字符、例如“§”、“#”、“@”等或非数字的或非字母的字符、“-”、“/”等自动地使用空白字符。随后,在相应的数据组D1至Dn的内容链中,在存在两个或更多个彼此相随的空白字符的情况下,通过删除/移除数量超出一个单独空白字符的彼此相随的空白字符的方式,将这些空白字符减少到一个空白字符。由此,移除日志文件P1至Pn的数据组D1至Dn中的、尤其消息部分N1至Nn(例如文本部分、报告部分、状态部分)中的、没有详细描述事件的字符。因此,以简单的方式和方法从日志文件P1至Pn的系统部分(例如系统事件、版本、补丁)中提取消息部分N1至Nn,从而使得对日志文件的进一步的处理和分析限制于内容相关的消息部分N1至Nn,并因此显著地简化和加速。
[0082] 随后,在另一步骤中,解除消息部分N1至Nn的内容的链接,由此分开内容、尤其字/短语。在此,内容例如划分成字/短语。
[0083] 为了进一步对数据组D1至Dn进行数据压缩,例如从数据组D1至Dn中移除具有小于四个、尤其小于三个字符的单独的字/短语。例如,删除字“是(Ist)”或“是的(Ja)”。这实现的是,简单且有效地将两个或更多个不同的条目/内容彼此在句法上(无语义学意义)且自动地进行比较。
[0084] 此外提出,对数据组D1至Dn、尤其是其单独的字母数字的内容、如具有尤其多于三个字符的剩余的单独的字/短语进行分析和统一,通过将参考字Rx分配给每个单独的字母数字的内容并且将数字的代码Kx分配给每个参考字Rx的方式。由此,为了归档数据组D1至Dn,显著地降低存储器需求,并且显著地加速其分析。
[0085] 例如,将消息内容的字和/或短语
[0086] -“允许范围中的环境温度”,
[0087] -“绿色范围中的涡轮机温度”,
[0088] -“激活首次启动”,
[0089] -“泵失效”,
[0090] -“启动涡轮机”
[0091] 转换成如下参考字Rx
[0092] -“环境温度是允许的”,
[0093] -“涡轮机温度是允许的”,
[0094] -“激活首次启动”,
[0095] -“泵失效”,
[0096] -“涡轮机启动”
[0097] 和/或转换成如下的数字的代码Kx:
[0098] -“123”,
[0099] -“423”,
[0100] -“56”,
[0101] -“7”,
[0102] -“8”。
[0103] 在此,将各个字例如借助于一位的数字的代码Kx编码。具有多于一个字的短语例如借助于一个数字的代码Kx编码,所述数字的代码具有对应于字数量的相应数量的位数。相同的字和/或短语借助相同的参考字Rx和相同的数字的代码Kx编码。具有部分一致字符和/或字的不同的数据组D1至Dn的字和/或短语利用至少在该位一致的数字的代码K进行编码。
[0104] 替代数字的代码Kx,能够应用字母的代码和/或字母数字的代码。借助于数字的代码Kx对数据组D1至Dn编码具有的优点是,对日志文件P1至Pn的数据组D1至Dn进行简单和快速的排列和分组。
[0105] 为了继续统一和压缩不同日志文件P1至Pn的数据组D1至Dn并且简单和快速地分析该数据组D1至Dn,根据确定的参考字Rx和/或数字的代码Kx,将具有全部日志文件P1至Pn的单独的字母数字的内容的、表格形式的总文件SD转换成二维的、尤其字母数字的代码矩阵KM。
[0106] 随后,在二维的代码矩阵KM中,将数字的代码Kx以时间顺序、尤其时间上升或下降地和/或取决于相应的字符长度地进行排序。例如,将数字的代码Kx“5632”、“543”、“64221”、“123”如下地排序:“123”、“543”、“5632”、“64221”。
[0107] 附加地,在另一步骤中,借助于相似性运算、尤其所谓的莱文斯坦距离对代码矩阵KM的相似的数字的代码Kx进行分组,尤其分配给至少一个组Gy(=簇)。
[0108] 在此,通过对应的组码KGy描述或表示每个组Gy。对应的组码KGy在此能够从第一数据组D1至Dn的至少数字的代码Kx中生成,所述数字的代码分配给所述组Gy。替选地,能够预设一个或多个组Gy的相应的组码KGy。
[0109] 例如,在新的待考虑的数字的代码Kx到组Gy中的一个组的莱文斯坦距离为零的情况下,将该待考虑的数字的代码Kx分配给这一个组Gy,因为待考虑的数字的代码Kx与组Gy相同,尤其与代表该组Gy的组码KGy相同。
[0110] 相反,在待考虑的数字的代码Kx到组Gy中的一个组的莱文斯坦距离为一的情况下,并且在待考虑的数字的代码Kx与该组Gy仅在一位处不相同的情况下,将该待考虑的数字的代码Kx分配给这一个组Gy。例如,在具有对应的子代码KGy为“12”的组Gy中,将具有如下位“123”、“124”、“12”和/或“13”的数字的代码Kx分配给该组Gy。
[0111] 为了在对数字的代码Kx进行随后的分析还有分组时改进和加速查询函数,在最后的组Gy中或在最后分配有之前的数字的代码Kx的组Gy中,启动待考虑的数字的代码Kx与已经生成的组Gy的比较。
[0112] 尤其是为了在分配有之前的数字的代码Kx的组Gy中的、新的待考虑的数字的代码Kx进行分组和分配而进行的启动加速了分组算法,因为通常相邻的、尤其时间上跟随的、但是也在时间上先前的、之前以时间排序的数字的代码Kx分配给同一事件,进而能够分配给同一组Gy。
[0113] 此外,能够将每个新生成的和因此新的待考虑的数字的代码Kx与相同长度的或具有长出最多一个字符的更长的长度的、未分组的数字的代码Kx进行比较。
[0114] 当新的待考虑的数字的代码Kx到另一未分组的数字的代码Kx的莱文斯坦距离等于一时,就由这两个数字的代码Kx通过如下的方式形成具有新的组码KGy+1的新的组Gy+1,即
[0115] -在这两个待考虑的数字的代码Kx的长度不同的情况下,将较短的数字的代码Kx作为新的组码KGy+1分配给新的组Gy+1(例如Kx=“123”和“12”产生具有新的组码KGy+1为“12”的新的组Gy),或者
[0116] -在具有至少一个不同字符的这两个数字的代码Kx的长度相同的情况下,将没有不同字符的数字的代码Kx作为新的组码KGy+1分配给新的组Gy+1(例如,Kx=“133”和“134”产生具有新的组码KGy+1为“13”的新的组Gy)。
[0117] 附加地或替选地,当到另一未分组的数字的代码Kx的莱文斯坦距离不等于一的、新的待考虑的数字的代码被识别出时,将该待考虑的数字的代码Kx分配给另外的新的组Gy+1。在此,将该新的待考虑的数字的代码Kx作为组码KGy+1分配给该另外的新的组Gy+1。将在与该新的组码KGy+1比较时具有为一的莱文斯坦距离的、未来的待考虑的数字的代码Kx分配给该新的组Gy+1。
[0118] 因此,二维的数字的代码Kx示出动态的专家系统,为了对描述事件的、相似的和/或相同的数字的代码Kx进行分组,通过添加另外的/新的日志文件P1至Pn的新的数字的代码Kx的方式,连续地扩展和补充具有组码KGy、KGy+1的确定的组Gy、Gy+1到该专家系统中。
[0119] 为了进一步处理数字的代码Kx和/或组码KGy、KGy+1的内容,对其进行解码,并且作为日志文件P1至Pn的字母数字的消息部分N1至Nn输出,并且例如能够存储在存储器10中。
[0120] 替选地或附加地,将该解码的且表示字母数字的消息部分N1至Nn的数字的代码Kx和组码KGy、KGy+1输送给管理单元4,以在显示屏上输出并对事件进一步分析和评估。
[0121] 此外,该方法允许的是,在开始该方法时仅使用预设数量的组Gy,并且不生成新的组Gy+1。由此,首先实现将新的待考虑的数字的代码Kx进行粗略分组。然后在继续运行时,能够允许生成新的组Gy+1。
[0122] 尽管通过优选的实施例详细阐明和描述了本发明,但是本发明不由公开的实例限制,并且本领域技术人员能够由此推导出其他的变型方案,而没有脱离本发明的保护范围。特别地,日志压缩器9在自动化系统1的一个部件中的适当的位处执行。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈