技术领域
[0001] 本
发明属于
移动广告反作弊领域,涉及一种手机广告作弊点击的判断方法。
背景技术
[0002] 大多数移动广告都是以点击计费:也就是说,用户在应用中看到广告,一旦发生一次点击,广告平台会付给应用开发者一定的
费用。在这种商业模式下,少数开发者会伪造用
户点击以获取更高收入。作弊的方式从早期的简单刷点击到现在更接近真实用户点击行为
多维度的一体化方案。
[0003] 互联网广告从一开始就要面对反作弊的问题,积累到现在已经有了一整套作弊点击识别方案,包括判断IP地址,
用户代理,地理区域,点击率,点击
频率,Cookie记录,
访问时间等等。对于更加隐蔽的作弊方式,有的广告平台甚至对用户一段时期内的展示和点击
行为进行深入挖掘,用一些复杂的
算法(如
信号处理领域里的
小波变换)判断用户行为的
真实性。
[0004] 在移动互联网中,点击作弊的行为也一直存在,上述互联网的作弊判断的方法可以直接使用。不过,移动互联网的一些独特的特点,如果用上述的方法进行作弊判断,其效
果有的时候并不是太好。
发明内容
[0005] 本发明基于移动互联网的特点,提供了一种移动互联网广告中基于用户设备上的
传感器数据对作弊点击进行识别的方案。
[0006] 本发明解决上述技术问题所采取的技术方案如下:
[0007] 一种手机广告作弊点击的判断方法,包括:
[0008] 当用户点击到屏幕的时候,分别基于手机内置的传感器获取到以下不同维度中的至少一种信息:
[0009] 当前手机广告点击的点击
位置、点击前后的震动变化、声音变化、用户眼球在广告区域的交点变化、与前一次点击的手机经纬度变化信息;
[0010] 基于各自的数据概率计算模型对上述信息进行处理,得到各自对应的是否为真实点击的概率;
[0011] 将所述各自对应的是否为真实点击的概率用回归模型进行处理,并计算本次点击是否为作弊的概率,其中,所述回归模型是基于大量真实的历史点击信息并对其进行训练
以后得到的回归模型。
[0012] 优选的是,还包括:获取广告的点击区域信息;
[0013] 基于当前手机广告点击的点击位置和广告的点击区域信息之间的关系,判断本次点击的当前手机广告点击的点击位置是否落在广告的点击区域内,并计算其是否为真实点
击的概率Dclick,取值范围在[0,1]之间。
[0014] 优选的是,获取点击前后的震动变化,计算是否为真实点击的概率,包括:
[0015] 通过
加速度传感器获得xyz轴的加速度数据,计算出振动的强度和方向,判断在点击前后的震动强度是否超出噪声值,并计算是否为真实点击的概率Vclick,取值范围在[0,
1]之间。
[0016] 优选的是,获取到当前手机点击的声音变化,计算是否为真实点击的概率,包括:
[0017] 通过噪声传感器获取本次广告点击的噪声值和背景噪声值,两者对比以判断本次广告点击的噪声值是否超过背景噪声值,计算其是否为真实点击的概率Sclick,取值范围在
[0,1]之间。
[0018] 优选的是,获取用户眼球在广告区域的交点变化信息,计算是否为真实点击的概率,包括:
[0019] 根据前置摄像头追踪用户的眼球变化,并计算用户眼球朝向在屏幕上的相交的位置;
[0020] 判断在点击前后该位置是否一直停留在广告点击区域内,计算其是否为真实点击的概率Mclick,取值范围在[0,1]之间。
[0021] 优选的是,获取本次和上一次点击的手机经纬度变化信息,计算是否为真实点击的概率,包括:
[0022] 根据获取到的点击前后的用户经纬度变化信息,计算其是否为真实点击的概率Ldistance,取值范围在[0,1]之间。
[0023] 优选的是,基于大量真实的历史点击信息并对其进行训练以后得到回归模型,包括:
[0024] 分别对大量真实的历史点击信息并对其进行标准化处理,形成集合,其中,针对某一个点击数据xclick:
[0025] xclick=(Dclick,Vclick,Sclick,Mclick,Lclick,ClassID),[ClassID∈(0,1)][0026] 其中,Dclick,Vclick,Sclick,Mclick,Lclick的定义如上,ClassID代表针对该点击数据是否为正常点击,1为正常点击,0为作弊点击,由人工分类;
[0027] 通过逻辑回归的方法得出回归模型,具体包括:
[0028] 对集合中的每一次点击,分别进行权重计算:
[0029]
[0030] 代表学习率,是一个常数值,并进行最终计算
[0031]
[0032] 最终的回归模型输出为:
[0033]
[0034] 本发明相对于现有的方法具有以下优点,即在判断广告点击是否作弊的时候,是基于多个因素并用历史点击信息进行训练以后得到的回归模型进行判断,即使仅仅获得一
个维度中的信息,其分析结果也相对更加精确。
[0035] 本发明的其它特征和优点将在随后的
说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明
书、
权利要求书、以及
附图中所特别指出的结构来实现和获得。
附图说明
[0036] 下面结合附图对本发明进行详细的描述,以使得本发明的上述优点更加明确。其中,
[0037] 图1是本发明
实施例一种手机广告作弊点击的判断方法的流程示意图。
具体实施方式
[0038] 将结合附图及实施例来详细说明本发明的实施方式,借此对本发明如何应用技术手段来解决技术问题,并达成技术效果的实现过程能充分理解并据以实施。需要说明的是,
只要不构成冲突,本发明中的各个实施例以及各实施例中的各个特征可以相互结合,所形
成的技术方案均在本发明的保护范围之内。
[0039] 另外,在附图的
流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处
的顺序执行所示出或描述的步骤。
[0040] 其中,本发明实施例中的名词和术语解释如下:
[0041] 加速度传感器:用于测量
牵引力引起的加速度。对于手机里安装的加速度传感器,一般是用来测量重力引起的加速度。通过对加速度变化的测量,可以推断出手机运动的方
式和方向。
[0042] 磁力计:测量不同方位的
磁场强度,可用于判断设备的朝向。
[0043] 噪音传感器:用于测量周边环境里的噪音强度,手机里的噪声传感器可用于话筒和麦克
风的降噪功能。
[0044] 用户代理(User Agent):用户使用的
软件或软件环境对自己的一个识别符,通常是一个字符串。
[0045] 基于
传感器数据的作弊点击判断也是一个综合一体化的方案,也就是说,本发明基于多个维度中的一个进行综合考量,而不是仅仅基于一个因子,即使仅仅获得某一个因
子或者某一个因子取值为0或者未计算出来,但是,只要上述五个因子有一个是能给获取
到的,就能给大概计算出其是否为作弊的概率,以此用于判断是否作弊或者初步判断中,降
低人工判断反作弊的成本和压力。
[0046] 具体来说,如图1所示,该方法具体包括:
[0047] 步骤101:当用户点击到屏幕的时候,分别基于手机内置的传感器获取到以下不同维度中的至少一种信息:
[0048] 当前手机广告点击的点击位置、点击前后的震动变化、声音变化、用户眼球在广告区域的交点变化、与前一次点击的手机经纬度变化信息;
[0049] 步骤102:基于各自的数据概率计算模型对上述信息进行处理,得到各自对应的是否为真实点击的概率;
[0050] 在一个实施例中,为了方便对本发明进行说明,假设每一个维度的信息都能够获取的(当然,该方法仅仅是获得一个维度的信息也是可以应用的)。
[0051] 由此,针对当前手机广告点击的点击位置,判断其是否为真实点击的概率,包括:获取到当前手机广告点击的点击位置信息,如点击坐标信息;
[0052] 获取广告的点击区域信息;
[0053] 基于点击坐标信息和广告的点击区域信息之间的关系,判断本次点击的当前手机广告点击的点击位置是否落在广告的点击区域内,计算其是否为真实点击的概率Dclick,取
值范围在[0,1]之间。
[0054] 其一个实施例中,该方法主要包括:
[0055] 由SDK调用系统API直接获取(xclick,yclick),广告
顶点坐标由SDK调用系统API进行获取左顶点坐标(xleft-top,yleft-top),右底点坐标(xright-bottom,yright-bottom)。
[0056] 计算其是否为真实点击的概率Dclick,
[0057]
[0058] 其中,SDK调用系统API获取相应的坐标信息对于本领域技术人员术说,是能够获取到的,因此,本发明针对具体的坐标获取方法不进行详细说明,但并不意味着对该部分内
容的描述不清楚。
[0059] 其中,获取点击前后的震动变化,计算是否为真实点击的概率,包括:
[0060] 通过加速度传感器获得xyz轴的加速度数据,计算出振动的强度和方向,判断在点击前后的震动强度是否超出噪声值,并计算是否为真实点击的概率Vclick,取值范围在[0,
1]之间。
[0061] 也就是说,绝大多数的真实点击,在用户的
手指触及屏幕时,都伴随着设备的一点轻微震动。这个震动发生的时间应该和点击发生的时间基本一致。同时震动发生的方向
(加速度传感器)通常来讲和屏幕的朝向(磁力计)相反,一般地,能够获取到以下的参数:
[0062] tclick点击时间,tvibrate震动时间,vvibrate震动量,以上三个值均可以通过SDK调用系统APl获取并回传
服务器。
[0063]
[0064] 其中,获取到当前手机点击的声音变化,计算是否为真实点击的概率,包括:通过噪声传感器获取本次广告点击的噪声值和背景噪声值,两者对比以判断本次广告点击的噪
声值是否超过背景噪声值,计算其是否为真实点击的概率Sclick,取值范围在[0,1]之间。
[0065] 具体来说,用户在滑动屏幕时几乎不会产生噪音,但是在点击屏幕时,经常会发出一点声音,这个声音虽然小,但是因为直接产生在屏幕上,可以被噪音传感器获取,所以,在点击发生时,背景噪声应该会有短暂的增强,随即又会回复到正常
水平。
[0066] tstart_click点击开始时间,tend_click点击结束时间,tsound为前两者之
[0067] 差,以上三个值均可以通过SDK调用系统API获取并回传服务器。
[0068] tsound=(tstartclick-tend_click)
[0069]
[0070] 其中,获取用户眼球在广告区域的交点变化信息,计算是否为真实点击的概率,,包括:
[0071] 根据前置摄像头追踪用户的眼球变化,并计算用户眼球朝向在屏幕上的相交的位置,判断在点击前后该位置是否一直停留在广告点击区域内,并计算其是否为真实点击的
概率Mclick,取值范围在[0,1]之间。
[0072] 其中,由于前置摄像头、手机屏幕、摄像头位置、用户的眼球之间的距离都能够于预先测试到或者计算到。例如,在一个简单的例子中,前置摄像头设置为两个,并位于手机
屏幕的上下位置,由此其能够对眼球的位置进行准确的
定位和计算。其实现方式上可以由
现有的技术实现,不进行详细说明。
[0073] 举例来说,
[0074] 眼球初始位置(xeye_center,yeye_center),眼球最终位置(xeye_position,yeye_position)以上四个值均可以通过SDK调用系统API获取并回传服务器。
[0075]
[0076]
[0077] 其中,获取本次点击与前一次点击的手机经纬度变化信息,计算是否为真实点击的概率,包括:获取本次点击与前一次点击的手机经纬度变化信息;计算其是否为真实点
击的概率Ldistance,取值范围在[0,1]之间。
[0078] 也就是说,在不考虑耗电的前提下,我们可以在点击发生时采集用户的经纬度(GPS)。那么如果两个相邻的点击间隔较小(作弊的情况下通常间隔都很小),对应位置的
差异应该也很小。
[0079] 其中,Lclick代表点击行为的经纬度的差值,取值范围为1~+co的连续值。初始经纬度位置(xoriginal_position,yoriginal_position),用户最终位置(xnew_position,ynew_position),两次取样的间隔时长tn
[0080]
[0081]
[0082] 步骤103:将所述各自对应的是否为真实点击的概率用回归模型进行处理,并计算本次点击是否为作弊的概率,其中,所述回归模型是基于大量真实的历史点击信息并对
其进行训练以后得到的回归模型。
[0083] 其中,基于大量真实的历史点击信息并对其进行训练以后得到回归模型,包括:
[0084] 分别对大量真实的历史点击信息并对其进行标准化处理,形成集合,其中,针对某一个点击数据xclick:
[0085] xclick=(Dclick,Vclick,Sclick,Mclick,Lclick,ClassID),[ClassID∈(0,1)][0086] 其中,Dclick,Vclick,Sclick,Mclick,Lclick的定义如上,C/assID代表针对该点击数据是否为正常点击,1为正常点击,0为作弊点击;
[0087] 通过逻辑回归的方法得出回归模型,具体包括:
[0088] 对集合中的每一次点击,分别进行权重计算:
[0089]
[0090] 代表学习率,是一个常数值,并进行最终计算
[0091]
[0092] 最终的回归模型输出为:
[0093]
[0094] 通过上述方法以后,对于新的点击,计算其各个维度的概率(Dclick,Vclick,Sclick,Mclick,Lclick),如果得分不在这个范围内,则有很大的可能是作弊点击。
[0095] 其中,在优选实施例中,上述计算都是在服务器侧进行计算。
[0096] 为此,为了防止开发者模拟这些维度数据,我们可以对这些数据做加密,或者做一些本地的
数据处理,并最终将处理的结果发送给服务器(比如经纬度数据,既可以上传原
始的经纬度,也可以上传相对于上次点击时位置的差值和方向),以此实现防止开发者模拟
数据的目的。
[0097] 需要说明的是,对于上述方法实施例而言,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本
申请并不受所描述的动作顺序的限制,因为
依据本申请,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知
悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模
块并不一定是本申请
所必须的。
[0098] 本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或
计算机程序产品。因此,本申请可采用完全
硬件实施例、完全软件实施例、或结合软件和硬件方面的实
施例的形式。
[0099] 而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘
存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的
形式。
[0100] 最后应说明的是:以上所述仅为本发明的优选实施例而已,并不用于限制本发明,尽管参照前述实施例对本发明进行了详细的说明,对于本领域的技术人员来说,其依然可
以对前述各实施例所记载的技术方案进行
修改,或者对其中部分技术特征进行等同替换。
凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的
保护范围之内。