首页 / 专利库 / 地球科学 / 热异常 / 点击热力图异常检测方法及装置

点击热异常检测方法及装置

阅读:967发布:2020-05-12

专利汇可以提供点击热异常检测方法及装置专利检索,专利查询,专利分析的服务。并且本 发明 公开了一种点击热 力 图 异常检测 方法及装置,可以获得第一点击热力图,将所述第一点击热力图分割为多个区域;对所述多个区域中每个区域:分别确定各点击来源对应的点击行为发生在该区域中的点击概率;对每个点击来源:根据所述点击概率确定该点击来源对应的异常点击区域。本发明根据各区域中各点击来源对应的点击行为发生在该区域中的点击概率确定异常点击区域,无需通过人工识别,准确性和识别效率较高。,下面是点击热异常检测方法及装置专利的具体信息内容。

1.一种点击热异常检测方法,其特征在于,包括:
获得第一点击热力图,将所述第一点击热力图分割为多个区域;
对所述多个区域中每个区域:分别确定各点击来源对应的点击行为发生在该区域中的点击概率;
对每个点击来源:根据所述点击概率确定该点击来源对应的异常点击区域,其中,所述异常点击区域为所述多个区域中的至少一个区域。
2.根据权利要求1所述的方法,其特征在于,所述将所述第一点击热力图分割为多个区域,包括:
将所述第一点击热力图平均分割为row×col个矩形区域,其中,row为所述第一点击热力图中所述矩形区域的行数,col为所述第一点击热力图中所述矩形区域的列数。
3.根据权利要求2所述的方法,其特征在于,所述对每个点击来源:根据所述点击概率确定该点击来源对应的异常点击区域,包括:
对每一个点击来源P:
确定该点击来源P相对于其他点击来源 的第一相对熵D1,
其中,i为矩形区域的行编号,j为矩形区域的列编号,di,j为区域异常标识,pi,j为点击来源P在第i行第j列的矩形区域的点击概率, 为除点击来源P外的其他点击来源 在第i行第j列的矩形区域的点击概率,di,j为0或1;
在D1小于第一预设阈值的情况下,确定在∑di,j的取值最大时的各di,j;
在∑di,j的取值最大时的各di,j中取值为0的di,j对应的矩形区域确定为异常点击区域。
4.根据权利要求2所述的方法,其特征在于,所述对每个点击来源:根据所述点击概率确定该点击来源对应的异常点击区域,包括:
确定各点击来源相对于其他点击来源的第二相对熵的和H最小时的各点击来源对应的各di,j,
其中,i为矩形区域的行编号,j为矩形区域的列编号,di,j为区域异常标识,pi,j为点击来源P在第i行第j列的矩形区域的点击概率, 为除点击来源P外的其他点击来源 在第i行第j列的矩形区域的点击概率,di,j为0或1,δ为惩罚系数,b为基准点击概率,b=1/(row×col);
对每一个点击来源:将该点击来源对应的各di,j中取值为0的di,j对应的矩形区域确定为异常点击区域。
5.根据权利要求2所述的方法,其特征在于,所述对每个点击来源:根据所述点击概率确定该点击来源对应的异常点击区域,包括:
对每个矩形区域:确定该矩形区域对应的各点击来源间的点击概率之比的最大值;
将大于第二预设阈值的所述最大值对应的矩形区域确定为异常点击区域,其中,所述第二预设阈值大于1。
6.一种点击热力图异常检测装置,其特征在于,包括:热力图获得单元、概率确定单元和区域确定单元,
所述热力图获得单元,用于获得第一点击热力图,将所述第一点击热力图分割为多个区域;
所述概率确定单元,用于对所述多个区域中每个区域:分别确定各点击来源对应的点击行为发生在该区域中的点击概率;
所述区域确定单元,用于对每个点击来源:根据所述点击概率确定该点击来源对应的异常点击区域,其中,所述异常点击区域为所述多个区域中的至少一个区域。
7.根据权利要求6所述的装置,其特征在于,所述热力图获得单元具体设置为:
将所述第一点击热力图平均分割为row×col个矩形区域,其中,row为所述第一点击热力图中所述矩形区域的行数,col为所述第一点击热力图中所述矩形区域的列数。
8.根据权利要求7所述的装置,其特征在于,所述区域确定单元具体设置为:
对每一个点击来源P:
确定该点击来源P相对于其他点击来源 的第一相对熵D1,
其中,i为矩形区域的行编号,j为矩形区域的列编号,di,j为区域异常标识,pi,j为点击来源P在第i行第j列的矩形区域的点击概率, 为除点击来源P外的其他点击来源 在第i行第j列的矩形区域的点击概率,di,j为0或1;
在D1小于第一预设阈值的情况下,确定在∑di,j的取值最大时的各di,j;
在∑di,j的取值最大时的各di,j中取值为0的di,j对应的矩形区域确定为异常点击区域。
9.一种存储介质,其特征在于,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行如权利要求1-5中任一项所述的点击热力图异常检测方法。
10.一种处理器,其特征在于,所述处理器用于运行程序,其中,所述程序运行时执行如权利要求1-5中任一项所述的点击热力图异常检测方法。

说明书全文

点击热异常检测方法及装置

技术领域

[0001] 本发明涉及流量作弊检测领域,尤其涉及点击热力图异常检测方法及装置。

背景技术

[0002] 随着互联网的发展,用户更多的通过电子设备浏览各种网站的网页或应用程序的界面。通过购买广告可以为广告购买方带来更多的互联网流量,从而使得更多的用户浏览和点击广告购买方网站的网页或应用程序的界面。但流量作弊行为长期损害着广告购买方的正当权益,例如一些刷流量的软件会自动且大量的访问广告购买方的网站并进行大量点击操作,这些点击操作没有为广告购买方带来收益,但广告购买方却需要为之付费。
[0003] 由于点击热力图可以很好的体现网站的网页或应用程序的界面中的点击情况,因此可以根据点击热力图确定异常点击行为从而识别异常流量。现有技术通过人工对点击热力图中的异常点击行为进行识别,准确性和识别效率较低。

发明内容

[0004] 鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的点击热力图异常检测方法及装置,方案如下:
[0005] 一种点击热力图异常检测方法,包括:
[0006] 获得第一点击热力图,将所述第一点击热力图分割为多个区域;
[0007] 对所述多个区域中每个区域:分别确定各点击来源对应的点击行为发生在该区域中的点击概率;
[0008] 对每个点击来源:根据所述点击概率确定该点击来源对应的异常点击区域,其中,所述异常点击区域为所述多个区域中的至少一个区域。
[0009] 可选的,所述将所述第一点击热力图分割为多个区域,包括:
[0010] 将所述第一点击热力图平均分割为row×col个矩形区域,其中,row为所述第一点击热力图中所述矩形区域的行数,col为所述第一点击热力图中所述矩形区域的列数。
[0011] 可选的,所述对每个点击来源:根据所述点击概率确定该点击来源对应的异常点击区域,包括:
[0012] 对每一个点击来源P:
[0013] 确定该点击来源P相对于其他点击来源 的第一相对熵D1,
[0014]
[0015] 其中,i为矩形区域的行编号,j为矩形区域的列编号,di,j为区域异常标识,pi,j为点击来源P在第i行第j列的矩形区域的点击概率, 为除点击来源P外的其他点击来源在第i行第j列的矩形区域的点击概率,di,j为0或1;
[0016] 在D1小于第一预设阈值的情况下,确定在∑di,j的取值最大时的各di,j;
[0017] 在∑di,j的取值最大时的各di,j中取值为0的di,j对应的矩形区域确定为异常点击区域。
[0018] 可选的,所述对每个点击来源:根据所述点击概率确定该点击来源对应的异常点击区域,包括:
[0019] 确定各点击来源相对于其他点击来源的第二相对熵的和H最小时的各点击来源对应的各di,j,
[0020]
[0021] 其中,i为矩形区域的行编号,j为矩形区域的列编号,di,j为区域异常标识,pi,j为点击来源P在第i行第j列的矩形区域的点击概率, 为除点击来源P外的其他点击来源在第i行第j列的矩形区域的点击概率,di,j为0或1,δ为惩罚系数,b为基准点击概率,b=1/(row×col);
[0022] 对每一个点击来源:将该点击来源对应的各di,j中取值为0的di,j对应的矩形区域确定为异常点击区域。
[0023] 可选的,所述对每个点击来源:根据所述点击概率确定该点击来源对应的异常点击区域,包括:
[0024] 对每个矩形区域:确定该矩形区域对应的各点击来源间的点击概率之比的最大值;
[0025] 将大于第二预设阈值的所述最大值对应的矩形区域确定为异常点击区域,其中,所述第二预设阈值大于1。
[0026] 一种点击热力图异常检测装置,包括:热力图获得单元、概率确定单元和区域确定单元,
[0027] 所述热力图获得单元,用于获得第一点击热力图,将所述第一点击热力图分割为多个区域;
[0028] 所述概率确定单元,用于对所述多个区域中每个区域:分别确定各点击来源对应的点击行为发生在该区域中的点击概率;
[0029] 所述区域确定单元,用于对每个点击来源:根据所述点击概率确定该点击来源对应的异常点击区域,其中,所述异常点击区域为所述多个区域中的至少一个区域。
[0030] 可选的,所述热力图获得单元具体设置为:
[0031] 将所述第一点击热力图平均分割为row×col个矩形区域,其中,row为所述第一点击热力图中所述矩形区域的行数,col为所述第一点击热力图中所述矩形区域的列数。
[0032] 可选的,所述区域确定单元具体设置为:
[0033] 对每一个点击来源P:
[0034] 确定该点击来源P相对于其他点击来源 的第一相对熵D1,
[0035]
[0036] 其中,i为矩形区域的行编号,j为矩形区域的列编号,di,j为区域异常标识,pi,j为点击来源P在第i行第j列的矩形区域的点击概率, 为除点击来源P外的其他点击来源在第i行第j列的矩形区域的点击概率,di,j为0或1;
[0037] 在D1小于第一预设阈值的情况下,确定在∑di,j的取值最大时的各di,j;
[0038] 在∑di,j的取值最大时的各di,j中取值为0的di,j对应的矩形区域确定为异常点击区域。
[0039] 一种存储介质,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行上述的任一种点击热力图异常检测方法。
[0040] 一种处理器,所述处理器用于运行程序,其中,所述程序运行时执行上述的任一种点击热力图异常检测方法。
[0041] 借由上述技术方案,本发明提供的点击热力图异常检测方法及装置,可以获得第一点击热力图,将所述第一点击热力图分割为多个区域;对所述多个区域中每个区域:分别确定各点击来源对应的点击行为发生在该区域中的点击概率;对每个点击来源:根据所述点击概率确定该点击来源对应的异常点击区域。本发明根据各区域中各点击来源对应的点击行为发生在该区域中的点击概率确定异常点击区域,无需通过人工识别,准确性和识别效率较高。
[0042] 上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。附图说明
[0043] 通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
[0044] 图1示出了本发明实施例提供的一种点击热力图异常检测方法的流程图
[0045] 图2示出了本发明实施例提供的一种点击热力图异常检测装置的结构示意图。

具体实施方式

[0046] 下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
[0047] 如图1所示,本发明实施例提供的一种点击热力图异常检测方法,可以包括:
[0048] S100、获得第一点击热力图,将所述第一点击热力图分割为多个区域;
[0049] 其中,步骤S100可以具体包括:
[0050] 将所述第一点击热力图平均分割为row×col个矩形区域,其中,row为所述第一点击热力图中所述矩形区域的行数,col为所述第一点击热力图中所述矩形区域的列数。
[0051] 在实际应用中,获得第一点击热力图的方式可以包括:
[0052] 从终端设备中采集点击数据;
[0053] 对采集的点击数据进行归一化处理;
[0054] 根据归一化处理后的点击数据获得第一点击热力图。
[0055] 具体的,本发明可以在终端设备中部署js代码,将访问者发出点击行为作为触发条件,当点击行为发生时,本发明部署的js代码将点击数据通过post请求发送至服务器中,这样就完成了从终端设备中采集点击数据的过程。
[0056] 由于不同网页在不同分辨率、页面大小的情况下,网页元素位置可能发现较大的改变,因此本发明可以对点击数据进行归一化处理,以排除分辨率、页面大小给网页元素位置带来的改变。
[0057] 具体的,本发明分割后得到的矩形区域中包含的像素点可以不超过100个,优选的,所述矩形区域为4像素×4像素的正方形区域。
[0058] 在实际应用中,有的矩形区域中的点击数据可能较小,这会导致点击数据较为离散,因此本发明可以使用高速滤波对各矩形区域中的点击量进行平滑处理。
[0059] S200、对所述多个区域中每个区域:分别确定各点击来源对应的点击行为发生在该区域中的点击概率;
[0060] S300、对每个点击来源:根据所述点击概率确定该点击来源对应的异常点击区域,其中,所述异常点击区域为所述多个区域中的至少一个区域。
[0061] 具体的,步骤S300有多种具体实施方法,下面示例性提供其中三种:
[0062] 第一种、步骤S300可以包括:
[0063] 对每一个点击来源P:
[0064] 确定该点击来源P相对于其他点击来源 的第一相对熵D1,
[0065]
[0066] 其中,i为矩形区域的行编号,j为矩形区域的列编号,di,j为区域异常标识,pi,j为点击来源P在第i行第j列的矩形区域的点击概率, 为除点击来源P外的其他点击来源在第i行第j列的矩形区域的点击概率,di,j为0或1;
[0067] 在D1小于第一预设阈值的情况下,确定在∑di,j的取值最大时的各di,j;
[0068] 在∑di,j的取值最大时的各di,j中取值为0的di,j对应的矩形区域确定为异常点击区域。
[0069] 本发明将除点击来源P外的其他点击来源作为一个整体: 并计算P相对于 的相对熵。
[0070] 可以理解的是,第一种方法得到的异常点击区域与点击来源相对应,即:当对点击来源A使用本发明的方法确定异常点击区域时,本发明确定的异常点击区域为点击来源A的异常点击区域,而非其他点击来源的异常点击区域。
[0071] 可以理解的是,∑di,j越大,则di,j取值为1的次数越多。由于本发明将取值为0的di,j对应的矩形区域确定为异常点击区域,将取值为1的di,j对应的矩形区域确定为正常点击区域,因此di,j取值为1的次数越多,则被确定为正常点击区域的矩形区域就越多。本发明通过第一预设阈值的限制,使得在某点击来源P相对于其他点击来源 的第一相对熵D1不会过高,从而控制了将异常点击区域误判为正常点击区域的数量。
[0072] 具体的,该第一种方法可以通过不同点击来源的点击概率,发现作弊的点击来源在一些低概率点击区域的异常点击行为,从而发现异常流量。本发明实施例所使用的相对熵,是一种衡量相对概率差异的方法,相对熵的计算结果随着点击概率差异增加而增加。通过相对熵计算结果的这一原理,本发明可以通过数值优化的方法,剔除点击概率差异较大的异常区域,实现不同点击来源的点击概率的差异最小化,从而得到满足预设条件的相对熵。相对应的,这些剔除的区域即是异常点击区域。需要指出的是,相对熵是一种计算相对分布差异的方法,本发明并不局限于使用相对熵,任何能够计算和衡量不同点击来源差异的方法均可用于本发明的点击热力图异常检测方法中。
[0073] 第二种、步骤S300可以包括:
[0074] 确定各点击来源相对于其他点击来源的第二相对熵的和H最小时的各点击来源对应的各di,j,
[0075]
[0076] 其中,i为矩形区域的行编号,j为矩形区域的列编号,di,j为区域异常标识,pi,j为点击来源P在第i行第j列的矩形区域的点击概率, 为除点击来源P外的其他点击来源在第i行第j列的矩形区域的点击概率,di,j为0或1,δ为惩罚系数,b为基准点击概率,b=1/(row×col);
[0077] 对每一个点击来源:将该点击来源对应的各di,j中取值为0的di,j对应的矩形区域确定为异常点击区域。
[0078] 具体的,该第二种方法可以为点击区域的误判设置惩罚系数,即:为将正常点击区域误判为异常点击区域、将异常点击区域误判为正常点击区域设置惩罚系数。第二种方法可以通过惩罚系数控制对di,j的优化过程,降低了误判率。
[0079] 第三种,步骤S300可以包括:
[0080] 对每个矩形区域:确定该矩形区域对应的各点击来源间的点击概率之比,并确定各点击来源间的点击概率之比中的最大值;
[0081] 将大于第二预设阈值的所述最大值对应的矩形区域确定为异常点击区域,其中,所述第二预设阈值大于1。
[0082] 可以理解的是,各点击来源间的点击概率之比中的最大值代表着一个矩形区域内各点击来源间点击概率的最大差距,如果该最大值较大,则代表着该矩形区域的异常,如果该最大值较小,则可以认为该矩形区域为正常点击区域。即:将不大于第二预设阈值的所述最大值对应的矩形区域确定为正常点击区域。
[0083] 具体的,第三种方法是在第一种方法和第二种方法的数学推理的基础上的一种简易方法。第三种方法可以在实际准确率不发生较大改变的情况下,极大的提高点击热力图异常检测的效率。
[0084] 本发明提供的点击热力图异常检测方法,可以获得第一点击热力图,将所述第一点击热力图分割为多个区域;对所述多个区域中每个区域:分别确定各点击来源对应的点击行为发生在该区域中的点击概率;对每个点击来源:根据所述点击概率确定该点击来源对应的异常点击区域。本发明根据各区域中各点击来源对应的点击行为发生在该区域中的点击概率确定异常点击区域,无需通过人工识别,准确性和识别效率较高。
[0085] 与上述方法实施例相对应,本发明实施例还提供了一种点击热力图异常检测装置。
[0086] 如图2所示,本发明实施例提供的一种点击热力图异常检测装置,可以包括:热力图获得单元100、概率确定单元200和区域确定单元300,
[0087] 所述热力图获得单元100,用于获得第一点击热力图,将所述第一点击热力图分割为多个区域;
[0088] 其中,所述热力图获得单元100可以具体设置为:
[0089] 获得第一点击热力图,将所述第一点击热力图平均分割为row×col个矩形区域,其中,row为所述第一点击热力图中所述矩形区域的行数,col为所述第一点击热力图中所述矩形区域的列数。
[0090] 所述概率确定单元200,用于对所述多个区域中每个区域:分别确定各点击来源对应的点击行为发生在该区域中的点击概率;
[0091] 所述区域确定单元300,用于对每个点击来源:根据所述点击概率确定该点击来源对应的异常点击区域,其中,所述异常点击区域为所述多个区域中的至少一个区域。
[0092] 其中,所述区域确定单元300可以具体设置为:
[0093] 对每一个点击来源P:
[0094] 确定该点击来源P相对于其他点击来源 的第一相对熵D1,
[0095]
[0096] 其中,i为矩形区域的行编号,j为矩形区域的列编号,di,j为区域异常标识,pi,j为点击来源P在第i行第j列的矩形区域的点击概率, 为除点击来源P外的其他点击来源在第i行第j列的矩形区域的点击概率,di,j为0或1;
[0097] 在D1小于第一预设阈值的情况下,确定在∑di,j的取值最大时的各di,j;
[0098] 在∑di,j的取值最大时的各di,j中取值为0的di,j对应的矩形区域确定为异常点击区域。
[0099] 其中,所述区域确定单元300可以具体设置为:
[0100] 确定各点击来源相对于其他点击来源的第二相对熵的和H最小时的各点击来源对应的各di,j,
[0101]
[0102] 其中,i为矩形区域的行编号,j为矩形区域的列编号,di,j为区域异常标识,pi,j为点击来源P在第i行第j列的矩形区域的点击概率, 为除点击来源P外的其他点击来源在第i行第j列的矩形区域的点击概率,di,j为0或1,δ为惩罚系数,b为基准点击概率,b=1/(row×col);
[0103] 对每一个点击来源:将该点击来源对应的各di,j中取值为0的di,j对应的矩形区域确定为异常点击区域。
[0104] 其中,所述区域确定单元300可以具体设置为:
[0105] 对每个矩形区域:确定该矩形区域对应的各点击来源间的点击概率之比的最大值;
[0106] 将大于第二预设阈值的所述最大值对应的矩形区域确定为异常点击区域,其中,所述第二预设阈值大于1。
[0107] 本发明提供的点击热力图异常检测装置,可以获得第一点击热力图,将所述第一点击热力图分割为多个区域;对所述多个区域中每个区域:分别确定各点击来源对应的点击行为发生在该区域中的点击概率;对每个点击来源:根据所述点击概率确定该点击来源对应的异常点击区域。本发明根据各区域中各点击来源对应的点击行为发生在该区域中的点击概率确定异常点击区域,无需通过人工识别,准确性和识别效率较高。
[0108] 所述点击热力图异常检测装置包括处理器和存储器,上述热力图获得单元、概率确定单元和区域确定单元等均作为程序单元存储在存储器中,由处理器执行存储在存储器中的上述程序单元来实现相应的功能。
[0109] 处理器中包含内核,由内核去存储器中调取相应的程序单元。内核可以设置一个或以上,通过调整内核参数来进行异常点击区域的确定。
[0110] 存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM),存储器包括至少一个存储芯片。
[0111] 本发明实施例提供了一种存储介质,其上存储有程序,该程序被处理器执行时实现所述点击热力图异常检测方法。
[0112] 本发明实施例提供了一种处理器,所述处理器用于运行程序,其中,所述程序运行时执行所述点击热力图异常检测方法。
[0113] 本发明实施例提供了一种设备,设备包括处理器、存储器及存储在存储器上并可在处理器上运行的程序,处理器执行程序时实现以下步骤:
[0114] 获得第一点击热力图,将所述第一点击热力图分割为多个区域;
[0115] 对所述多个区域中每个区域:分别确定各点击来源对应的点击行为发生在该区域中的点击概率;
[0116] 对每个点击来源:根据所述点击概率确定该点击来源对应的异常点击区域,其中,所述异常点击区域为所述多个区域中的至少一个区域。
[0117] 可选的,所述将所述第一点击热力图分割为多个区域,包括:
[0118] 将所述第一点击热力图平均分割为row×col个矩形区域,其中,row为所述第一点击热力图中所述矩形区域的行数,col为所述第一点击热力图中所述矩形区域的列数。
[0119] 可选的,所述对每个点击来源:根据所述点击概率确定该点击来源对应的异常点击区域,包括:
[0120] 对每一个点击来源P:
[0121] 确定该点击来源P相对于其他点击来源 的第一相对熵D1,
[0122]
[0123] 其中,i为矩形区域的行编号,j为矩形区域的列编号,di,j为区域异常标识,pi,j为点击来源P在第i行第j列的矩形区域的点击概率, 为除点击来源P外的其他点击来源在第i行第j列的矩形区域的点击概率,di,j为0或1;
[0124] 在D1小于第一预设阈值的情况下,确定在∑di,j的取值最大时的各di,j;
[0125] 在∑di,j的取值最大时的各di,j中取值为0的di,j对应的矩形区域确定为异常点击区域。
[0126] 可选的,所述对每个点击来源:根据所述点击概率确定该点击来源对应的异常点击区域,包括:
[0127] 确定各点击来源相对于其他点击来源的第二相对熵的和H最小时的各点击来源对应的各di,j,
[0128]
[0129] 其中,i为矩形区域的行编号,j为矩形区域的列编号,di,j为区域异常标识,pi,j为点击来源P在第i行第j列的矩形区域的点击概率, 为除点击来源P外的其他点击来源在第i行第j列的矩形区域的点击概率,di,j为0或1,δ为惩罚系数,b为基准点击概率,b=1/(row×col);
[0130] 对每一个点击来源:将该点击来源对应的各di,j中取值为0的di,j对应的矩形区域确定为异常点击区域。
[0131] 可选的,所述对每个点击来源:根据所述点击概率确定该点击来源对应的异常点击区域,包括:
[0132] 对每个矩形区域:确定该矩形区域对应的各点击来源间的点击概率之比的最大值;
[0133] 将大于第二预设阈值的所述最大值对应的矩形区域确定为异常点击区域,其中,所述第二预设阈值大于1。
[0134] 本文中的设备可以是服务器、PC、PAD、手机等。
[0135] 本申请还提供了一种计算机程序产品,当在数据处理设备上执行时,适于执行初始化有如下方法步骤的程序:
[0136] 获得第一点击热力图,将所述第一点击热力图分割为多个区域;
[0137] 对所述多个区域中每个区域:分别确定各点击来源对应的点击行为发生在该区域中的点击概率;
[0138] 对每个点击来源:根据所述点击概率确定该点击来源对应的异常点击区域,其中,所述异常点击区域为所述多个区域中的至少一个区域。
[0139] 可选的,所述将所述第一点击热力图分割为多个区域,包括:
[0140] 将所述第一点击热力图平均分割为row×col个矩形区域,其中,row为所述第一点击热力图中所述矩形区域的行数,col为所述第一点击热力图中所述矩形区域的列数。
[0141] 可选的,所述对每个点击来源:根据所述点击概率确定该点击来源对应的异常点击区域,包括:
[0142] 对每一个点击来源P:
[0143] 确定该点击来源P相对于其他点击来源 的第一相对熵D1,
[0144]
[0145] 其中,i为矩形区域的行编号,j为矩形区域的列编号,di,j为区域异常标识,pi,j为点击来源P在第i行第j列的矩形区域的点击概率, 为除点击来源P外的其他点击来源在第i行第j列的矩形区域的点击概率,di,j为0或1;
[0146] 在D1小于第一预设阈值的情况下,确定在∑di,j的取值最大时的各di,j;
[0147] 在∑di,j的取值最大时的各di,j中取值为0的di,j对应的矩形区域确定为异常点击区域。
[0148] 可选的,所述对每个点击来源:根据所述点击概率确定该点击来源对应的异常点击区域,包括:
[0149] 确定各点击来源相对于其他点击来源的第二相对熵的和H最小时的各点击来源对应的各di,j,
[0150]
[0151] 其中,i为矩形区域的行编号,j为矩形区域的列编号,di,j为区域异常标识,pi,j为点击来源P在第i行第j列的矩形区域的点击概率, 为除点击来源P外的其他点击来源在第i行第j列的矩形区域的点击概率,di,j为0或1,δ为惩罚系数,b为基准点击概率,b=1/(row×col);
[0152] 对每一个点击来源:将该点击来源对应的各di,j中取值为0的di,j对应的矩形区域确定为异常点击区域。
[0153] 可选的,所述对每个点击来源:根据所述点击概率确定该点击来源对应的异常点击区域,包括:
[0154] 对每个矩形区域:确定该矩形区域对应的各点击来源间的点击概率之比的最大值;
[0155] 将大于第二预设阈值的所述最大值对应的矩形区域确定为异常点击区域,其中,所述第二预设阈值大于1。
[0156] 本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
[0157] 本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
[0158] 这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
[0159] 这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
[0160] 在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
[0161] 存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。存储器是计算机可读介质的示例。
[0162] 计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
[0163] 还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。
[0164] 本领域技术人员应明白,本申请的实施例可提供为方法、系统或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
[0165] 以上仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈