首页 / 专利库 / 信号处理 / 过采样 / 一种应用系统性能异常检测方法和系统

一种应用系统性能异常检测方法和系统

阅读:110发布:2024-01-13

专利汇可以提供一种应用系统性能异常检测方法和系统专利检索,专利查询,专利分析的服务。并且本 发明 涉及一种应用系统性能 异常检测 方法和系统,该系统包括流量采集模 块 、性能元数据索引模块、性能异常检测模块和性能异常 定位 模块,该方法如下:S1、采集应用系统原始流量数据;S2、对原始流量数据进行会话重组,采用ElasticSearch技术对性能元数据进行索引;S3、周期性计算各个应用系统的平均响应时间,构建应该响应时间基线数据模型,确定为应用性能异常;S4、通过性能元数据索引检索异常应用系统在故障时间点的所有性能元数据,通过性能元数据的IP信息确定故障点,并发出性能告警信息。本发明创新性的采用性能元数据技术,基于数据视 角 ,采用 大数据 全文检索技术,对应用系统性能进行实时分析与 关联性分析 ,从而对应用系统性能问题有全面的掌控。,下面是一种应用系统性能异常检测方法和系统专利的具体信息内容。

1.一种应用系统性能异常检测系统,其特征在于:该系统包括流量采集模、性能元数据索引模块、性能异常检测模块和性能异常定位模块,其中:
流量采集模块:通过对应用系统所在网络的路由器或交换机的流量镜像,采集应用系统原始流量数据;
性能元数据索引模块:对原始流量数据进行会话重组,针对各个会话计算会话请求处理阶段的响应时间,通过对会话发生时间、IP、端口、所属应用系统信息的分析,以类NetFlow格式构建会话性能元数据,采用ElasticSearch技术对性能元数据进行索引;
性能异常检测模块:周期性计算各个应用系统的平均响应时间,构建应该响应时间基线数据模型,当应用系统当前平均响应时间与该应用的响应时间趋势模型偏离较大时,确定为应用性能异常;
性能异常定位模块:通过性能元数据索引检索异常应用系统在故障时间点的所有性能元数据,各个会话响应时间进行排序获得性能最差会话,通过性能元数据的IP信息确定故障点,并发出性能告警信息;
其中,所述性能元数据索引模块构建会话性能元数据的实现如下:
对原始流量数据包进行IP分片重组和TCP会话重组;
采用五元组确定会话,五元组是{源IP地址,源端口,目的IP地址,目的端口和传输层协议号}这五个量组成的一个集合,采用TCP头中的SequenceNumber来保证数据报文的顺序;
会话是应用系统性能元数据的载体,重组后的会话为:
S={S0,S1,S2,S3,S4,S5,......Sn};
计算各个会话请求响应时间,在会话重组过程中,会话Si包含的原始数据包序列为:
P={P0,P1,P2,P3,P4,P5,......Pm};
其中,各个数据包发生的时间为:
T={t1,t2,t3,t4,t5,t6,......tm};
因此,计算获得会话Si的响应时长为:rt=tm-t1;
构建性能元数据,性能元数据表征了五元组相同的一组会话在计算周期内应用性能分析信息,其目的是分析某应用系统内客户端IP与服务端IP在某特点时间内的响应性能状态;性能元数据的数据格式设计为:
性能元数据的计算采用聚合算法,聚合条件是五元组{源IP地址,源端口,目的IP地址,目的端口和传输层协议号;}聚合对象是计算周期内的会话序列,表征为:
S={S0,S1,S2,S3,S4,S5,......Sn}
该序列会话对应的响应时间为:
RT={rt0,rt1,rt2,rt3,rt4,rt5,......rtn}
则,性能元数据计算为:
元数据五元组信息与聚合条件五元组一致;
报文总数 包含报文个数;
字节总数 包含字节个数;
最大响应时间rtmax=MAX(rti)(0<=i<=n);
平均响应时间
最小响应时间rtmin=MIN(rti)(0<=i<=n);
应用系统id等于聚合条件五元组中目的IP所属的应用系统的id;
以此,获得性能元数据序列为:
R={r0,r1,r2,r3,r4,r5,......rn}
索引性能元数据,对性能元数据序列按照时间以增量方式向索引库添加数据,建立索引采用分布式检索工具ElasticSearch完成。
2.根据权利要求1所述的一种应用系统性能异常检测系统,其特征在于:所述系统的流量采集模块,通过对应用系统所在网络的路由器或交换机的流量镜像,采集应用系统完整的原始流量数据。
3.一种应用系统性能异常检测方法,其特征在于:该方法包括如下步骤:
S1、采用流量采集模块,通过对应用系统所在网络的路由器或交换机的流量镜像,采集应用系统原始流量数据;
S2、采用性能元数据索引模块,对原始流量数据进行会话重组,针对各个会话计算会话请求处理阶段的响应时间,通过对会话发生时间、IP、端口、所属应用系统信息的分析,以类NetFlow格式构建会话性能元数据;采用ElasticSearch技术对性能元数据进行索引;
S3、采用性能异常检测模块,周期性计算各个应用系统的平均响应时间,构建应该响应时间基线数据模型,当应用系统当前平均响应时间与该应用的响应时间趋势模型偏离较大时,确定为应用性能异常;
S4、采用性能异常定位模块,通过性能元数据索引检索异常应用系统在故障时间点的所有性能元数据,各个会话响应时间进行排序获得性能最差会话,通过性能元数据的IP信息确定故障点,并发出性能告警信息;
其中,所述的步骤S2性能元数据索引模块中,会话性能元数据的实现如下:
S21、对原始流量数据包进行IP分片重组和TCP会话重组;
采用五元组确定会话,五元组是{源IP地址,源端口,目的IP地址,目的端口和传输层协议号}这五个量组成的一个集合,采用TCP头中的SequenceNumber来保证数据报文的顺序;
会话是应用系统性能元数据的载体,重组后的会话为:
S={S0,S1,S2,S3,S4,S5,......Sn};
S22、计算各个会话请求响应时间,在会话重组过程中,会话Si包含的原始数据包序列为:
P={P0,P1,P2,P3,P4,P5,......Pm};
其中,各个数据包发生的时间为:
T={t1,t2,t3,t4,t5,t6,......tm};
因此,计算获得会话Si的响应时长为:rt=tm-t1;
S23、构建性能元数据,性能元数据表征了五元组相同的一组会话在计算周期内应用性能分析信息,其目的是分析某应用系统内客户端IP与服务端IP在某特点时间内的响应性能状态;性能元数据的数据格式设计为:
性能元数据的计算采用聚合算法,聚合条件是五元组{源IP地址,源端口,目的IP地址,目的端口和传输层协议号;}聚合对象是计算周期内的会话序列,表征为:
S={S0,S1,S2,S3,S4,S5,......Sn}
该序列会话对应的响应时间为:
RT={rt0,rt1,rt2,rt3,rt4,rt5,......rtn}
则,性能元数据计算为:
元数据五元组信息与聚合条件五元组一致;
报文总数 包含报文个数;
字节总数 包含字节个数;
最大响应时间rtmax=MAX(rti)(0<=i<=n);
平均响应时间
最小响应时间rtmin=MIN(rti)(0<=i<=n);
应用系统id等于聚合条件五元组中目的IP所属的应用系统的id;
以此,获得性能元数据序列为:
R={r0,r1,r2,r3,r4,r5,......rn}
索引性能元数据,对性能元数据序列按照时间以增量方式向索引库添加数据,建立索引采用分布式检索工具ElasticSearch完成。
4.根据权利要求3所述的一种应用系统性能异常检测方法,其特征在于:所述的步骤S3性能异常检测模块,实现步骤具体如下:
S31、基线构建阶段:根据设定的学习周期和采样点时长,建立各个应用系统的响应性能基线,该基线包括各个应用系统平均响应时间的正常值和波动范围;
设定学习周期采用learn_time表示,采样点时长采用sample_time表示;
设企业网络中的应用系统序列为:
S={S0,S1,S2,S3,S4,S5,......Sn}
则响应性能基线为:
其中,采样点个数1=learn_time/sample_time;
S32、性能检测阶段:根据基线建立阶段建立的各个应用系统平均响应时间的正常值,判断当前应用系统的响应时间是否异常,并根据当前的响应时间值,动态更新基线。
5.根据权利要求3所述的一种应用系统性能异常检测方法,其特征在于:所述的步骤S4性能异常检测模块,实现步骤具体如下:
S41、提取相关性能元数据:根据检测阶段获得应用业务系统Si 在某采样时间段出现了性能异常,从性能元数据索引中获得应用业务系统Si在该采样时间段的所有性能元数据;
S42、构建业务性能响应链:按照[源IP,目的IP]二元组对性能元数据进行分组,计算每个元组的平均性能响应时间;按照源IP、目的IP次序构建性能响应链;
S43、定位性能故障点:计算业务性能响应链中响应时间最大的[源IP,目的IP]二元组,该二元组即为故障点。

说明书全文

一种应用系统性能异常检测方法和系统

技术领域

[0001] 本发明涉及信息安全领域,具体涉及一种大型企业应用系统性能异常检测方法和系统。

背景技术

[0002] 在今天的IT环境中,企业的各种业务已经越来越紧密地与Internet结合在一起,由服务器数据库中间件等组成的应用信息系统也变得越来越复杂,对IT技术人员的要求变得越来越高,各种突发故障排除起来也越来越困难。而企业利润的增长和获得直接取决于业务能否有效运行,应用的运行质量直接关系用户可以提供的业务平。在那些关键应用上对性能监控管理,对性能问题进行及时有效的分析和处理,是提高用户业务的迫切需要。
[0003] 在一个业务系统上线运行后,衡量该系统运行质量的尺度必然是考察其完成业务的能、速度和稳定性。由于应用的执行状况直接反映了业务运行的质量,所以对应用的监控、分析、优化和从应用度对系统的观察,是性能管理最重要的方面。
[0004] 大部分系统性能的下降都和应用有关,这是最主要因素。由于当今业务本身的多变性,业务模型是不断变化的;业务的发展也使得软硬件平台不断升级,业务的扩充和迁移也是经常性的;由于软件产品的特性,高度产品化而且高度易于客户化的应用软件在很多领域远未实现。以上种种因素使得今天的关键应用面临的性能问题存在于开发和生产运行的整个生命周期内。
[0005] 用户在IT应用系统上进行了大规模的投资,用以保障其业务系统能够高效率地运行。随着IT应用的不断深化,其规模也越来越大、越来越复杂。如何保障IT应用系统能够稳定、高效率的运行越来越受到了用户的重视。
[0006] 到目前为止,网络性能测试的工具网络性能测试Spirent TestCenter主要适用于网络二到七层的测试,包括:核心及边缘路由器的MPLS-VPN,二层VPNs,组播路由,IPv4/v6路由协议的相关测试;二层级及三层交换机的VLANs,RFC 2544/2889,TP/RSTP/MSTP,MEF的相关测试;接入及汇聚的DHCP/PPP/SIP仿真、IPTV频道切换和视频质量测试;四到七层网络应用流量如HTTP,FTP等的仿真测试。信息产业部的提出了系列性能测试规范:
[0007] YD/T 1260-2003基于端口的虚拟局域网(VLAN)技术要求和测试方法;
[0008] YD/T 1287-2003具有路由功能的以太网交换机测试方法;
[0009] YD/T 1141-2001千兆比以太网交换机测试方法;
[0010] YD/T 1251.1-2003路由协议一致性测试方法—中间系统到中间系统路由交换协议(IS-IS);
[0011] YD/T 1251.2-2003路由协议一致性测试方法—开放最短路径优先协议(OSPF);
[0012] YD/T 1251.3-2003路由协议一致性测试方法—边界网关协议(BGP4);
[0013] YD/T 1156-2001路由器测试规范—高端路由器;
[0014] YD/T 1098-2001路由器测试规范-低端路由器;
[0015] YD/T 1240-2002接入网设备测试方法--基于以太网技术的宽带接入网设备;
[0016] YD/T 1075-2000网络接入服务器(NAS)测试方法。
[0017] 但是,目前热点事件分析的研究往往侧重于网络性能分析,针对运行于网络之上的实际业务性能的分析较少,针对业务性能分析的手段也往往只针对实时分析,缺乏真正有效的分析能力。

发明内容

[0018] 有鉴于此,本发明的目的在于克服现有技术的不足,提供一种应用系统性能异常检测方法和系统。本发明针对复杂企业网络环境,创新性的采用了性能元数据方案,基于大数据分析的视角,对应用系统性能进行异常检测和故障定位分析。
[0019] 为实现上述目的,本发明采取以下技术方案:
[0020] 一种应用系统性能异常检测系统,该系统包括流量采集模、性能元数据索引模块、性能异常检测模块和性能异常定位模块,其中:
[0021] 流量采集模块:通过对应用系统所在网络的路由器或交换机的流量镜像,采集应用系统原始流量数据;
[0022] 性能元数据索引模块:对原始流量数据进行会话重组,针对各个会话计算会话请求处理阶段的响应时间,通过对会话发生时间、IP、端口、所属应用系统信息的分析,以类NetFlow格式构建会话性能元数据;采用ElasticSearch技术对性能元数据进行索引;
[0023] 性能异常检测模块:周期性计算各个应用系统的平均响应时间,构建应该响应时间基线数据模型,当应用系统当前平均响应时间与该应用的响应时间趋势模型偏离较大时,确定为应用性能异常;
[0024] 性能异常定位模块:通过性能元数据索引检索异常应用系统在故障时间点的所有性能元数据,各个会话响应时间进行排序获得性能最差会话,通过性能元数据的IP信息确定故障点,并发出性能告警信息。
[0025] 所述系统的流量采集模块,通过对应用系统所在网络的路由器或交换机的流量镜像,采集应用系统完整的原始流量数据。
[0026] 本发明基于上述系统还提供了一种应用系统性能异常检测方法,该方法包括如下步骤:
[0027] S1、采用流量采集模块,通过对应用系统所在网络的路由器或交换机的流量镜像,采集应用系统原始流量数据;
[0028] S2、采用性能元数据索引模块,对原始流量数据进行会话重组,针对各个会话计算会话请求处理阶段的响应时间,通过对会话发生时间、IP、端口、所属应用系统信息的分析,以类NetFlow格式构建会话性能元数据;为了适应复杂网络多点采集的情况,会话元数据的传输同时支持UDP协议与TCP协议;采用ElasticSearch技术对性能元数据进行索引;
[0029] S3、采用性能异常检测模块,周期性计算各个应用系统的平均响应时间,构建应该响应时间基线数据模型,当应用系统当前平均响应时间与该应用的响应时间趋势模型偏离较大时,确定为应用性能异常;
[0030] S4、采用性能异常定位模块,通过性能元数据索引检索异常应用系统在故障时间点的所有性能元数据,各个会话响应时间进行排序获得性能最差会话,通过性能元数据的IP信息确定故障点,并发出性能告警信息。
[0031] 本发明中的性能元数据索引模块之构建会话性能元数据、性能异常检测模块具体实现步骤以及性能异常定位模块具体实现步骤将在实施例中做进一步详述。
[0032] 本发明提供的应用系统性能异常检测系统包括流量采集模块、性能元数据索引模块、性能异常检测模块和性能异常定位模块,创新性的采用性能元数据技术,基于数据视角,采用大数据全文检索技术,对应用系统性能进行实时分析与关联性分析,从而对应用系统性能问题有全面的掌控。
[0033] 本发明的有益效果为:
[0034] 1)、采用本发明提供的技术方案,有利于企业IT技术人员高效便捷的排除各种突发故障;
[0035] 2)、能够对系统的性能监控,对性能问题进行及时有效的分析和处理,提供系统运行效率;
[0036] 3)、本发明针对运行于网络之上的实际业务性能分析,创新性的采用性能元数据技术,基于数据视角,采用大数据全文检索技术,对应用系统性能进行实时分析与关联性分析,从而对应用系统性能问题有全面的掌控。附图说明
[0037] 图1是本发明应用系统性能异常检测方法流程图

具体实施方式

[0038] 下面结合附图和实施例对本发明进行详细的描述。
[0039] 本发明提供一种应用系统性能异常检测系统,该系统包括流量采集模块、性能元数据索引模块、性能异常检测模块和性能异常定位模块,其中:
[0040] 流量采集模块:通过对应用系统所在网络的路由器或交换机的流量镜像,采集应用系统原始流量数据;
[0041] 性能元数据索引模块:对原始流量数据进行会话重组,针对各个会话计算会话请求处理阶段的响应时间,通过对会话发生时间、IP、端口、所属应用系统信息的分析,以类NetFlow格式构建会话性能元数据;采用ElasticSearch技术对性能元数据进行索引;
[0042] 性能异常检测模块:周期性计算各个应用系统的平均响应时间,构建应该响应时间基线数据模型,当应用系统当前平均响应时间与该应用的响应时间趋势模型偏离较大时,确定为应用性能异常;
[0043] 性能异常定位模块:通过性能元数据索引检索异常应用系统在故障时间点的所有性能元数据,各个会话响应时间进行排序获得性能最差会话,通过性能元数据的IP信息确定故障点,并发出性能告警信息。
[0044] 所述系统的流量采集模块,通过对应用系统所在网络的路由器或交换机的流量镜像,采集应用系统完整的原始流量数据。
[0045] 本发明应用系统性能异常检测系统包括流量采集模块、性能元数据索引模块、性能异常检测模块和性能异常定位模块,创新性的采用性能元数据技术,基于数据视角,采用大数据全文检索技术,对应用系统性能进行实时分析与关联性分析,从而对应用系统性能问题有全面的掌控。
[0046] 如图1所示,本发明还提供了一种应用系统性能异常检测方法,该方法包括如下步骤:
[0047] S1、采用流量采集模块,通过对应用系统所在网络的路由器或交换机的流量镜像,采集应用系统原始流量数据;
[0048] S2、采用性能元数据索引模块,对原始流量数据进行会话重组,针对各个会话计算会话请求处理阶段的响应时间,通过对会话发生时间、IP、端口、所属应用系统信息的分析,以类NetFlow格式构建会话性能元数据;为了适应复杂网络多点采集的情况,会话元数据的传输同时支持UDP协议与TCP协议;采用ElasticSearch技术对性能元数据进行索引;
[0049] S3、采用性能异常检测模块,周期性计算各个应用系统的平均响应时间,构建应该响应时间基线数据模型,当应用系统当前平均响应时间与该应用的响应时间趋势模型偏离较大时,确定为应用性能异常;
[0050] S4、采用性能异常定位模块,通过性能元数据索引检索异常应用系统在故障时间点的所有性能元数据,各个会话响应时间进行排序获得性能最差会话,通过性能元数据的IP信息确定故障点,并发出性能告警信息。
[0051] 作为本发明的一种优先实施方式,所述的步骤S2性能元数据索引模块中,会话性能元数据的实现如下:
[0052] S21、对原始流量数据包进行IP分片重组和TCP会话重组;
[0053] 采用五元组确定会话,五元组是{源IP地址,源端口,目的IP地址,目的端口和传输层协议号}这五个量组成的一个集合,采用TCP头中的Sequence Number来保证数据报文的顺序;会话是应用系统性能元数据的载体,重组后的会话为:
[0054] S={s0,s1,s2,s3,s4,s5,......sn};
[0055] S22、计算各个会话请求响应时间,在会话重组过程中,会话si包含的原始数据包序列为:
[0056] P={p0,p1,p2,p3,p4,p5,......pm};
[0057] 其中,各个数据包发生的时间为:
[0058] T={t1,t2,t3,t4,t5,t6,......tm};
[0059] 因此,计算获得会话si的响应时长为:
[0060] rt=tm-t1;
[0061] S23、构建性能元数据,性能元数据表征了五元组相同的一组会话在计算周期内应用性能分析信息,其目的是分析某应用系统内客户端IP与服务端IP在某特点时间内的响应性能状态;性能元数据的数据格式设计如下表:
[0062]
[0063]
[0064] 性能元数据的计算采用聚合算法,聚合条件是五元组{源IP地址,源端口,目的IP地址,目的端口和传输层协议号};聚合对象是计算周期内的会话序列,表征为:
[0065] S={s0,s1,s2,s3,s4,s5,......sn}
[0066] 该序列会话对应的响应时间为:
[0067] RT={rt0,rt1,rt2,rt3,rt4,rt5,......rtn}
[0068] 则,性能元数据计算为:
[0069] 元数据五元组信息与聚合条件五元组一致;
[0070] 报文总数 包含报文个数;
[0071] 字节总数 包含字节个数;
[0072] 最大响应时间rtmax=MAX(rti) (0<=i<=n);
[0073] 平均响应时间
[0074] 最小响应时间rtmin=MAX(rti) (0<=i<=n);
[0075] 应用系统id等于聚合条件五元组中目的IP所属的应用系统的id;
[0076] 以此,获得性能元数据序列为:
[0077] R={r0,r1,r2,r3,r4,r5,......rn}
[0078] S41、索引性能元数据,对性能元数据序列按照时间以增量方式向索引库添加数据,建立索引采用分布式检索工具ElasticSearch完成。
[0079] 作为本发明的一种优先实施方式,所述的步骤S3性能异常检测模块,实现步骤具体如下:
[0080] S31、基线构建阶段:根据设定的学习周期和采样点时长,建立各个应用系统的响应性能基线,该基线包括各个应用系统平均响应时间的正常值和波动范围;
[0081] 设定学习周期采用learn_time表示,采样点时长采用sample_time表示;
[0082] 设企业网络中的应用系统序列为:
[0083] S={s0,s1,s2,s3,s4,s5,......sn}
[0084] 则响应性能基线为:
[0085]
[0086] 其中,采样点个数l=learn_time/sample_time;
[0087] S32、性能检测阶段:根据基线建立阶段建立的各个应用系统平均响应时间的正常值,判断当前应用系统的响应时间是否异常,并根据当前的响应时间值,动态更新基线。
[0088] 作为本发明的一种优先实施方式,所述的步骤S4性能异常检测模块,实现步骤具体如下:
[0089] S41、提取相关性能元数据:根据检测阶段获得应用业务系统si在某采样时间段出现了性能异常,从性能元数据索引中获得应用业务系统si在该采样时间段的所有性能元数据;
[0090] S42、构建业务性能响应链:按照[源IP,目的IP]二元组对性能元数据进行分组,计算每个元组的平均性能响应时间;按照源IP、目的IP次序构建性能响应链。
[0091] S43、定位性能故障点:计算业务性能响应链中响应时间最大的[源IP,目的IP]二元组,该二元组即为故障点。
[0092] 本发明不局限于上述最佳实施方式,任何人在本发明的启示下都可得出其他各种形式的产品,但不论在其形状或结构上作任何变化,凡是具有与本申请相同或相近似的技术方案,均落在本发明的保护范围之内。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈