专利汇可以提供基于LSTM自编码网络的URL参数异常值检测方法专利检索,专利查询,专利分析的服务。并且本 发明 公开了一种基于LSTM自编码网络的URL参数异常值检测方法,本发明将URL参数序列化,利用LSTM在时序 序列表 达方面的优势,建立LSTM自编码模型,对输入数据编码后再进行解码输出,设定输入与输出损失最小为优化目标,通过优化 算法 不断更新网络权重,最终得到网络模型和损失范围,根据损失范围设定损失 阈值 T,将损失大于阈值T的数据识别为攻击数据,本方法对数据分析时会考虑数据的上下文关系,有较强的模型表达能 力 ,对恶意URL的检测达到较好的效果,提高了URL参数攻击识别的准确率,减少漏报、误报。,下面是基于LSTM自编码网络的URL参数异常值检测方法专利的具体信息内容。
1.一种基于LSTM自编码网络的URL参数异常值检测方法,其特征在于,包含以下步骤:
S1、通过urllib模块对URL地址进行处理对URL地址进行处理,包括转义、解码、提取URL参数;
S2、对提取的URL参数数据构建词表,词表中包括出现过的所有字符,将其一一标号,得到词表;
S3、根据词表对URL参数数据编码,转化为序列数据并截取统一长度;
S4、通过Embedding词嵌入将数据映射为嵌入矩阵;
S5、搭建LSTM自编码网络,得到网络模型;
S6、计算所有训练数据的损失,取误差最大值作为阈值T;
S7、测试网络模型效果,使用混有攻击数据的URL进行测试,重复步骤S2、S3、S4、S5,当得到混有攻击数据损失值大于阈值T时,识别为攻击数据,损失值小于等于阈值T时,识别为正常数据;
所述步骤S5中,LSTM的关键在于单元状态,单元状态从头到尾运行,通过门的结构来对单元状态增加或者删除信息,包括遗忘门、输入门、输出门、单元状态,分别通过以下公式计算获得:
遗忘门:ft=σ(Wf·[ht-1,x]+bf) (1)输入门:it=σ(Wi·[ht-1,xt]+bi) (2)状态门:候选状态量
更新状态:
输出门:ot=σ(Wo[ht-1,xt]+bo) (5)ht=ot·tanh(Ct) (6)式中W为对应权值,b为偏置量,xt为当前输入数据,ht-1为前一刻的输出值,σ为Sigmoid函数,计算公式为 tanh为双曲正切函数,计算公式为 当t时刻输
入时间序列Xt和t-1时刻的隐藏变量ht-1,首先,在遗忘门生成ft,见公式(1),决定单元中丢弃何种信息,然后,在输入门生成it,见公式(2),决定存储何种信息,接着创建候选向量见公式(3),根据在t-1时刻状态门Ct-1更新t时刻状态量Ct,见公式(4),最后,在输出门生成ot,见公式(5),并在状态量Ct和状态量ot的作用下,生成t时刻的隐藏变量ht,见公式(6),进而影响t+1时刻LSTM单元的变化,自编码网络是一种无监督学习算法,包括编码器、解码器,编码器的输出是解码器的输入,使用反向传播算法,让目标值等于输入值,LSTM自编码网络包括编码器、解码器、损失函数和优化器,编码器与解码器均为LSTM搭建,编码器的输出为解码器的输入,将中间网络层当作隐藏层,损失函数计算输出与输入的误差,以损失最小为优化目标,进行反向传播,应用优化函数不断更新网络权值,假设时间序列X={x1,x2,…xn},其中n为数据长度,对应的理论输出为 当时刻t的数据xt输入自编码
网络,xt为序列X在t时刻的值,其中1<<t<<n,得到的输出表示为yt=LSTMforward(xt,ct-1,ht-1),其中LSTMforward表示上述LSTM前向传播单元状态的计算方法,序列X的自编码网络的输出为Yt=LSTMforward(Xt,ct-1,ht-1)={y1,y2,…yn},接下来计算输入与输出的误差,选用均方误差作为误差计算公式,训练过程的损失函数定义为 设
定损失函数最小为优化目标,给定网络初始化的随机种子数、学习率以及训练次数,应用Adam优化算法不断更新网络权重,待损失收敛后,得到最终的网络模型。
标题 | 发布/更新时间 | 阅读量 |
---|---|---|
基于深度学习的具有自适应学习率的设备故障诊断方法 | 2020-05-08 | 709 |
一种基于机器学习和ceph思想的分布式储存方法 | 2020-05-11 | 1002 |
使用迭代人工智能通过通信决策树的有向轨迹 | 2020-05-14 | 495 |
一种文本标签提取系统 | 2020-05-12 | 427 |
射频基因库建立方法及违法违规无线电波检测方法 | 2020-05-12 | 586 |
一种Web攻击检测方法、系统、介质和设备 | 2020-05-16 | 326 |
模块化神经网络的直接定位方法 | 2020-05-19 | 295 |
一种基于深度置信网络的电网虚拟数据注入攻击的检测方法 | 2020-05-18 | 661 |
基于CDBN-SVR的空气预热器转子变形软测量方法 | 2020-05-13 | 908 |
车辆道路噪声辅助分析评估方法及其系统 | 2020-05-16 | 309 |
高效检索全球专利专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。
我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。
专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。