首页 / 专利库 / 人工智能 / 机器学习 / 监督学习 / 相似性学习 / 一种基于主动学习的病毒检测方法、终端设备及存储介质

一种基于主动学习的病毒检测方法、终端设备及存储介质

阅读:210发布:2020-05-11

专利汇可以提供一种基于主动学习的病毒检测方法、终端设备及存储介质专利检索,专利查询,专利分析的服务。并且本 发明 涉及一种基于主动学习的病毒检测方法、终端设备及存储介质,该方法中包括:S1:构建已标记样本集L,并将所有待检测病毒代码组成未标记样本集U;S2:提取所有样本的特征,并进行格式规范化处理;S3:将L中样本的特征作为输入,对样本分类模型进行训练;S4:将U中样本的特征作为输入,利用基于最大特征距离的样本选择策略对U中的样本进行选择,将选择出的样本加入待标记样本集S中;S5:利用基于最小估计 风 险的样本标记策略对S中估计风险值最低的样本进行标记,并将标记后的样本加入L中;S6:更新L和U,返回步骤S3,直到U中所有样本均被标记完毕。本发明实现了已标记样本较少情况下的病毒代码检测。,下面是一种基于主动学习的病毒检测方法、终端设备及存储介质专利的具体信息内容。

1.一种基于主动学习的病毒检测方法,其特征在于,包括以下步骤:
S1:构建已标记样本集L,并将所有待检测病毒代码组成未标记样本集U;
S2:提取已标记样本集L和未标记样本集U中所有样本的特征,并对提取的特征进行格式规范化处理;
S3:将已标记样本集L中样本的特征作为输入,对样本分类模型进行训练;
S4:将未标记样本集U中样本的特征作为输入,利用基于最大特征距离的样本选择策略对未标记样本集U中的样本进行选择,将选择出的样本加入待标记样本集S中;
S5:利用基于最小估计险的样本标记策略对待标记样本集S中估计风险值最低的样本进行标记,并将标记后的样本加入已标记样本集L中;
S6:更新已标记样本集L和未标记样本集U,返回步骤S3,直到未标记样本集U中所有样本均被标记完毕。
2.根据权利要求1所述的基于主动学习的病毒检测方法,其特征在于:步骤S2的具体流程为:
S21:对病毒代码进行分词处理,将其分为多个函数,并确定每个函数的权重;
S22:对每个函数均进行哈希运算,得到对应的哈希值;
S23:对每个函数的哈希值进行按位加权运算;
S24:将该病毒代码的所有函数的按位加权运算结果进行按位累加;
S25:将该病毒代码的按位累加结果进行归一化处理。
3.根据权利要求2所述的基于主动学习的病毒检测方法,其特征在于:每个函数的权重的设定中根据该函数是否可能导致系统出现安全问题进行设定。
4.根据权利要求2所述的基于主动学习的病毒检测方法,其特征在于:步骤S25中归一化处理的方法为:将大于0的位置1,否则置0。
5.根据权利要求1所述的基于主动学习的病毒检测方法,其特征在于:步骤S4具体为:
对未标记样本特征集U中的样本两两之间计算其海明距离,提取出计算的所有海明距离中的最大值,将该最大值对应的两个样本加入待标记样本集S中。
6.根据权利要求1所述的基于主动学习的病毒检测方法,其特征在于:步骤S5中待标记样本集S中每个样本的风险值的计算方法为:将该样本与已标记样本集L中的各样本分别进行相似性度量,并利用训练后的样本分类模型对该样本和已标记样本集L中的各样本的类型分别进行预测,根据相似性度量结果和预测结果计算该样本的风险值。
7.根据权利要求6所述的基于主动学习的病毒检测方法,其特征在于:两个样本之间的相似性度量方法为:设定两个样本的特征分别为Hs={y1,y2,...,yr,...,yb},Hl={z1,z2,...,zr,...,zb},其中,下标1,2,…,r,…,b分别表示样本特征中位数的序号,r表示位数,b表示总位数,yr、zr分别表示两个样本的特征Hs、Hl所对应的第r位对应的数值,则两个样本的特征Hs与Hl之间的相似性度量sim(Hs,Hl)的计算公式为:
8.根据权利要求7所述的基于主动学习的病毒检测方法,其特征在于:样本的风险值的计算公式为:
其中, 表示待标记样本集合S中序号为s的样本为正常代码类的风险值, 表示待标记样本集合S中序号为s的样本为病毒代码类的风险值,l+表示已标记样本集合L中的正常代码类中的某一样本,l_表示已标记样本集合L中的病毒代码类中的某一样本,Hs表示待标记样本集合S中序号为s的样本的特征,Hl+表示已标记样本集合L中的正常代码类中的某一样本的特征,Hl_表示已标记样本集合L中的病毒代码类中的某一样本的特征,C(Hs)表示特征Hs通过样本分类模型的类型预测结果,C(Hl_)表示特征Hl_通过样本分类模型的类型预测结果,函数sim()表示相似性度量。
9.一种基于主动学习的病毒检测终端设备,其特征在于:包括处理器、存储器以及存储在所述存储器中并在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如权利要求1~8中任一所述方法的步骤。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1~8中任一所述方法的步骤。

说明书全文

一种基于主动学习的病毒检测方法、终端设备及存储介质

技术领域

[0001] 本发明涉及病毒检测领域,尤其涉及一种基于主动学习的病毒检测方法、终端设备及存储介质。

背景技术

[0002] 近年来,二进制病毒代码数量依然呈上升的趋势,尤其是新型二进制病毒代码,其数量始终呈逐年递增状态,这对网络空间安全造成了极大的威胁。随着技术的不断发展,机器学习能够自动发掘病毒代码的内在规律并不断完善自身的性能,进而实现对未知病毒代码的检测。因此,相比于传统的基于特征码、hash值等的检测技术,采用基于机器学习的方法对病毒代码进行建模和检测时具有更高的检测率,其已成为病毒代码检测领域的研究热点。
[0003] 在机器学习的训练阶段,往往需要大量的、完备的病毒代码样本集才能达到理想的检测效果。然而在现实网络环境中,一方面,病毒代码样本,特别是新型病毒代码样本,数量较少,难以形成完备的训练集,从而影响了病毒代码的检测效果;另一方面,对病毒代码进行分析和标注也需要大量的人和物力,从而影响了病毒代码的检测效率。因此,如何在小规模病毒代码样本的情况下实现较为理想的检测效果和效率,是病毒代码检测领域研究的重点和难点。现实情况中,在新型病毒代码出现之初,被标记的病毒样本数量较少,难以训练泛化能力较强的检测模型,若采用人工的方式对未知的病毒样本进行标记,则需要大量的人力和物力。

发明内容

[0004] 为了解决上述问题,本发明提出了一种基于主动学习的病毒检测方法、终端设备及存储介质。
[0005] 具体方案如下:
[0006] 一种基于主动学习的病毒检测方法,包括以下步骤:
[0007] S1:构建已标记样本集L,并将所有待检测病毒代码组成未标记样本集U;
[0008] S2:提取已标记样本集L和未标记样本集U中所有样本的特征,并对提取的特征进行格式规范化处理;
[0009] S3:将已标记样本集L中样本的特征作为输入,对样本分类模型进行训练;
[0010] S4:将未标记样本集U中样本的特征作为输入,利用基于最大特征距离的样本选择策略对未标记样本集U中的样本进行选择,将选择出的样本加入待标记样本集S中;
[0011] S5:利用基于最小估计险的样本标记策略对待标记样本集S中估计风险值最低的样本进行标记,并将标记后的样本加入已标记样本集L中;
[0012] S6:更新已标记样本集L和未标记样本集U,返回步骤S3,直到未标记样本集U中所有样本均被标记完毕。
[0013] 进一步的,步骤S2的具体流程为:
[0014] S21:对病毒代码进行分词处理,将其分为多个函数,并确定每个函数的权重;
[0015] S22:对每个函数均进行哈希运算,得到对应的哈希值;
[0016] S23:对每个函数的哈希值进行按位加权运算;
[0017] S24:将该病毒代码的所有函数的按位加权运算结果进行按位累加;
[0018] S25:将该病毒代码的按位累加结果进行归一化处理。
[0019] 进一步的,每个函数的权重的设定中根据该函数是否可能导致系统出现安全问题进行设定。
[0020] 进一步的,步骤S25中归一化处理的方法为:将大于0的位置1,否则置0。
[0021] 进一步的,步骤S4具体为:对未标记样本特征集U中的样本两两之间计算其海明距离,提取出计算的所有海明距离中的最大值,将该最大值对应的两个样本加入待标记样本集S中。
[0022] 进一步的,步骤S5中待标记样本集S中每个样本的风险值的计算方法为:将该样本与已标记样本集L中的各样本分别进行相似性度量,并利用训练后的样本分类模型对该样本和已标记样本集L中的各样本的类型分别进行预测,根据相似性度量结果和预测结果计算该样本的风险值。
[0023] 进一步的,两个样本之间的相似性度量方法为:设定两个样本的特征分别为Hs={y1,y2,...,yr,...,yb},Hl={z1,z2,...,zr,...,zb},其中,下标1,2,…,r,…,b分别表示样本特征中位数的序号,r表示位数,b表示总位数,yr、zr分别表示两个样本的特征Hs、Hl所对应的第r位对应的数值,则两个样本的特征Hs与Hl之间的相似性度量sim(Hs,Hl)的计算公式为:
[0024]
[0025] 进一步的,样本的风险值的计算公式为:
[0026]
[0027]
[0028] 其中, 表示待标记样本集合S中序号为s的样本为正常代码类的风险值,表示待标记样本集合S中序号为s的样本为病毒代码类的风险值,l+表示已标记样本集合L中的正常代码类中的某一样本,l-表示已标记样本集合L中的病毒代码类中的某一样本,Hs表示待标记样本集合S中序号为s的样本的特征,Hl+表示已标记样本集合L中的正常代码类中的某一样本的特征,Hl-表示已标记样本集合L中的病毒代码类中的某一样本的特征,C(Hs)表示特征Hs通过样本分类模型的类型预测结果,C(Hl-)表示特征Hl-通过样本分类模型的类型预测结果,函数sim()表示相似性度量。
[0029] 一种基于主动学习的病毒检测终端设备,包括处理器、存储器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现本发明实施例上述的方法的步骤。
[0030] 一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现本发明实施例上述的方法的步骤。
[0031] 本发明采用如上技术方案,研究了基于选择标记策略及主动学习算法的二进制病毒代码检测方法,提出了基于最大距离的样本选择策略和基于最小估计风险的样本标记策略,实现了已标记样本较少情况下的病毒代码检测。相比于未使用主动学习的方法,该方法的总体检测效果更好,在已标记样本数量占比为10%的情况下,其比随机选择策略的主动学习的效果更好,在时间性能上比人工标记策略的主动学习效果更好。附图说明
[0032] 图1所示为本发明实施例一的流程图
[0033] 图2所示为该实施例中步骤S2的流程图。
[0034] 图3所示为该实施例中基于最大特征距离的样本选择策略流程图。
[0035] 图4所示为该实施例中基于最小估计风险的样本标记策略的流程图。

具体实施方式

[0036] 为进一步说明各实施例,本发明提供有附图。这些附图为本发明揭露内容的一部分,其主要用以说明实施例,并可配合说明书的相关描述来解释实施例的运作原理。配合参考这些内容,本领域普通技术人员应能理解其他可能的实施方式以及本发明的优点。
[0037] 现结合附图和具体实施方式对本发明进一步说明。
[0038] 实施例一:
[0039] 本发明实施例的目的是在少量已标记样本条件下提高对未标记样本的检测率。
[0040] 提供了一种基于主动学习的病毒检测方法,如图1所示,其为本发明实施例所述的基于主动学习的病毒检测方法的流程图,所述方法包括以下步骤:
[0041] S1:采集已标记样本构建已标记样本集L,并将所有待检测病毒代码组成未标记样本集U。
[0042] 所述已标记样本集L中的代码样本被标记为恶意代码标签或正常代码标签。
[0043] S2:提取已标记样本集L和未标记样本集U中所有样本的特征,并对提取的特征进行格式规范化处理,将其表示成统一的格式。
[0044] 在二进制病毒代码检测中,样本的特征提取和处理是后续建模检测的关键,该实施例中主要将样本的API调用函数作为特征提取的对象。
[0045] API函数是病毒代码实现其恶意行为并与系统交互所必须的函数,虽然API函数本身是没有恶意性的,但是二进制病毒代码通过某些API函数的组合,可使其所表示的行为构成恶意性,而这些行为在正常文件中是不常见的,如进程的注入操作、关键系统文件的更改和删除等。因此,该实施例的特征提取中对API函数的调用序列Xi={api1,api2,...apin}进行提取,其中,i(i∈L∪U)表示第i个样本,n表示API函数的数量。
[0046] 由于序列的长度不一,将其直接作为特征会增加后续建模的计算复杂度,从而影响检测的效果,因此,该实施例中采用simhash算法对该序列进行规范化处理,将每个特征都表示成相同位数的二进制形式。
[0047] 如图2所示,步骤S2具体包括以下步骤:
[0048] S21:对病毒代码(即调用序列)Xi进行分词处理,将其分为多个函数,并确定每个函数的权重。
[0049] 该实施例中每个函数的权重的设定中根据该函数是否可能导致系统出现安全问题进行设定,如若该函数可能导致系统出现安全问题,则权重wk设为2,否则wk设为1。
[0050] S22:对每个函数均进行哈希(hash)运算,得到对应的哈希值。
[0051] 哈希值为二进制数01组成的n位数值的签名,比如“API1”的哈希值Hash(API1)为100101,“API2”的哈希值Hash(API2)为“101011”。通过哈希运算可以将字符串转变成一系列数字。
[0052] S23:对每个函数的哈希值进行按位加权运算。
[0053] 该实施例中还进一步设定:若哈希值中某位的值为1,则该位的权重wk设为正,否则设为负。
[0054] 所述按位加权运算为将二进制的哈希值中的每一位均与权重进行相乘,如“API1”的哈希值进行按位加权运算的结果为:W(API1)=100101*4=4 -4 -4 4 -4 4,“API2”的哈希值进行按位加权运算的结果为:W(API2)=101011*5=5 -5 5 -5 5 5。
[0055] S24:将该病毒代码Xi的所有函数的按位加权运算结果进行按位累加。
[0056] 如“API1”的“4 -4 -4 4 -4 4”和“API2”的“5 -5 5 -5 5 5”进行累加,得到“4+5-4+-5 -4+5 4+-5 -4+5 4+5”,即为“9 -9 1 -1 1”。
[0057] S25:将该病毒代码Xi的按位累加结果进行归一化处理(降维),得到simhash值Hi,该simhash值Hi即为API调用序列的特征。
[0058] 所述归一化处理为:将大于0的位置1,否则置0。如上述步骤S24计算的结果“9 -9 1 -1 1”经过归一化处理后的结果为“1 0 1 0 1 1”,该结果为该调用序列Xi的simhash签名。
[0059] S3:将已标记样本集L中样本的特征作为输入,对样本分类模型进行训练,得到训练后的样本分类模型。
[0060] 该实施例中采用基于随机森林模型的分类器C作为样本分类模型。
[0061] S4:将未标记样本集U中样本的特征作为输入,利用基于最大特征距离的样本选择策略对未标记样本集U中的样本进行选择,将选择出的样本加入待标记样本集S中。
[0062] 基于最大特征距离的样本选择策略的目的是从大量未标记样本中选择具有标记价值的样本,这一方面能够减少后续标记的工作量,提高整个主动学习算法的检测速度;另一方面能够提高标记的准确率,降低无用样本带来的干扰。
[0063] 在主动学习初期,已标记的样本较少,训练的分类器泛化性能较低,难以对特征相近的样本进行预测,选择特征差异较大的样本能够降低预测难度。而同一类样本的特征存在相似性,相似性越低的样本,其特征之间的差异越大。基于上述原因,该实施例中提出了一种基于最大特征距离的样本选择策略,将样本特征间的海明距离(HammingDistance)作为样本差异性的衡量标准,其目的是从未标记样本集U中选择出待标记的样本集S,以为后续的样本标记提供支持。所述海明距离是指两个相同长度的字符串相同位置上不同的字符的个数。由于表示样本特征的数据的格式为二进制形式,因此使用海明距离能够更好地反映各特征在位数上的差异。
[0064] 所述海明距离的计算方法为:海明距离是两个总位数为b位的长码字,例如z={z1z2...zr...zb}和y={y1y2...yr...yb}之间对应位的不同比特总数,其计算公式为:
[0065]
[0066] 其中,yr∈{0,1},zr∈{0,1},DHam(y,z)表示y和z在相同位置上不同比特数的总数,总数越多相似度越低。如对于两个API调用序列的特征H1=10010111和H2=1010100,其中不同的位数共有3位,因此,两者的海明距离Dham(H1,H2)=3。
[0067] 该实施例中假设病毒样本由于其恶意性会大量调用敏感函数,使得其API调用较为相似,利用基于最大特征距离的样本选择策略进行选择的方法为:对未标记样本特征集U中的样本两两之间计算其海明距离,提取出计算的所有海明距离中的最大值,将该最大值对应的两个样本加入待标记样本集S中。
[0068] 如图3所示,基于最大特征距离的样本选择策略的算法描述如下所示:
[0069] 输入:未标记样本集U,设其中的样本总数为u。
[0070] 输出:待标记样本集S。
[0071] 步骤1、初始化设定变量i=1,j=i+1,i,j∈U。
[0072] 步骤2、计算第i个和第j个未标记样本的海明距离Dham(i,j),并将计算结果存储于集合D中。
[0073] 步骤3、判断是否满足j<=u,如果是,令j=j+1,返回步骤2;否则,进入步骤4。
[0074] 步骤4、判断是否满足i<=u-1,如果是,令i=i+1,返回步骤2;否则,进入步骤5。
[0075] 步骤5、计算集合D中的最大值MAX{D},选择最大值对应的两个样本加入待标记样本集S中。
[0076] S5:利用基于最小估计风险的样本标记策略对待标记样本集S中估计风险值最低的样本进行标记,并将标记后的样本加入已标记样本集L中。
[0077] 基于最小估计风险的样本标记策略的目的是通过分析样本自身的信息和规律,利用机器自动对样本进行标记,以进一步提升算法的检测速度。
[0078] 在传统的主动学习过程中,从未标记样本集U中选择出待标记样本后通常都是采用人工交互的方式进行标记,会消耗大量的人力和物力,还存在标记速度过慢的缺点,难以快速进行检测。因此,该实施例中结合相似性度量,利用最小估计风险的方法对样本自动进行标记,如图4所示。
[0079] (1)其中,待标记样本集S中每个样本的风险值的计算方法为:将该样本与已标记样本集L中的各样本分别进行相似性度量,并利用训练后的样本分类模型对该样本和已标记样本集L中的各样本的类型分别进行预测,根据相似性度量结果和预测结果计算该样本的风险值。
[0080] (2)在海明距离计算的基础上增加相似性度量的标准,对待标记样本集S中每个样本的特征与已标记样本集L中每个样本的特征进行度量,其度量原理为:特征越相似的两个样本,其属于同一类样本的可能性就越大。通过与不同类样本进行相似性度量,可初步确定待选择样本属于某一类的概率。两个样本之间的相似性度量方法为:设定两个样本的特征分别为Hs={y1,y2,...,yr,...,yb},Hl={z1,z2,...,zr,...,zb},其中,下标1,2,…,r,…,b分别表示样本特征中位数的序号,r表示位数,b表示总位数,即yr表示特征Hs的第r位,zr表示特征Hl的第r位,yr、zr分别表示两个样本的特征Hs、Hl所对应的第r位对应的数值,则两个样本的特征Hs与Hl之间的相似性度量sim(Hs,Hl)的计算公式为:
[0081]
[0082] (3)风险值计算的基本思想是:对某样本的分类器C的预测结果与相似性度量结果进行综合评估,估计风险越低说明该样本标签被标记正确的概率就越大。其主要过程包括:
[0083] 首先,设定分类器C的预测结果为C(H),(C(H)∈{0,1}),预测的标签为h()(h∈{病毒代码,正常代码})。
[0084] 其次,为了进一步确定样本的标记情况,在相似性度量的基础上,对分类器C的预测结果与相似性度量的结果进行风险值的估计,将估计风险值最小的样本及其标记输出。
[0085] 其中,对病毒代码类和正常代码类的风险值的计算公式为:
[0086]
[0087]
[0088] 其中, 表示待标记样本集合S中序号为s的样本为正常代码类的风险值,表示待标记样本集合S中序号为s的样本为病毒代码类的风险值,l+表示已标记样本集合L中的正常代码类中的某一样本,l-表示已标记样本集合L中的病毒代码类中的某一样本,Hs表示待标记样本集合S中序号为s的样本的特征,Hl+表示已标记样本集合L中的正常代码类中的某一样本的特征,Hl-表示已标记样本集合L中的病毒代码类中的某一样本的特征,C(Hs)表示特征Hs通过样本分类模型的类型预测结果,C(Hl-)表示特征Hl-通过样本分类模型2
的类型预测结果,函数sim()表示相似性度量,(C(Hs)-C(Hl-))表示该样本与相应类样本预测的差异。
[0089] 当两个样本的相似性较高但预测差异较大时,估计的风险值较大。当样本预测结果相似或其本身相似性较低时,不会引起估计风险的增加。最后比较风险值的大小,选择风险值最低的样本及其标记输出。例如,对于待标记样本s1,s2,s3,其估计风险值最低的为则标记h(s1)为病毒代码。
[0090] S6:更新已标记样本集L和未标记样本集U,返回步骤S3,直到未标记样本集U中所有样本均被标记完毕。此时完成了所有待检测病毒代码的分类检测工作。
[0091] 本实施例研究了基于选择标记策略及主动学习算法的二进制病毒代码检测方法,提出了基于最大距离的样本选择策略和基于最小估计风险的样本标记策略,实现了已标记样本较少情况下的病毒代码检测。相比于未使用主动学习的方法,该方法的总体检测效果更好,在已标记样本数量占比为10%的情况下,其比随机选择策略的主动学习的效果更好,在时间性能上比人工标记策略的主动学习效果更好。
[0092] 另外,本实施例还与现有方法进行了对比实验,结果如下:
[0093] 在现有的研究中,基于支持向量机的主动学习方法,即将最靠近SVM分类面的样本作为不确定样本,对其进行人工标记并加入原训练集,然后重新训练分类模型。还有在SVM的基础上引入了一种直推式支持向量机的方法,其利用待分类样本的内部信息来提高学习器的局部分类性能。实验结果表明,在少标注样本少于400的情况下,TSVM比SVM约高出4%~6%的性能。另一种主动学习方法是基于委员会投票选择的主动学习技术,其通过训练多个分类器,将投票不一致的样本进行标记并重新加入训练集,能够使用很少的样本达到理想的检测精度。相比于SVM,该方法的速度更快。但是上述方式在选择未标注的样本后,都采用人工标注的方式对样本进行标记,时间开销较高,不利于快速形成检测。通过计算样本的相似性,再结合最小化估计风险的主动学习来选择样本,省去了人工标注的环节,直接将相似度较高的样本加入原来的训练集,在小规模病毒代码样本的情况下降低了错误率。但是,该方法的局限性较大,需要构建数据依赖网络并找到重要资源对象,不具有通用性。
[0094] 因此,本实施例通过对主动学习的选择策略和标记策略进行改进,利用样本自身信息和分类器自动标记未知样本,提出一种最大特征距离选择策略和最小估计风险标记策略的主动学习方法。该方法选择性地对样本进行标记且不依赖于人工,进一步提高了主动学习的效率,能够在病毒代码样本数量较少的情况下不断增量训练,逐渐提高模型的泛化能力,从而达到较为理想的检测效果,为新型病毒代码的检测提供了支持。
[0095] 本实施例针对病毒代码出现之初,用于分析检测的样本数量较少的现实情况,在原有的主动学习算法的基础上设计了基于最大距离的样本选择策略和最小估计风险的样本标记策略,在L/(L+U)较小的情况下,采用该算法比采用随机选择策略的主动学习算法的检测效果更优。在时间性能上,采用该算法比采用人工标记策略的主动学习算法更具优势。同时,与不采用主动学习的机器学习算法相比,该算法具有更好的检测效果,而且在少量样本集和L/(L+U)较小的情况下,该检测方法的优势更加明显。可见,本发明提出的检测方法具有一定的实用价值,能够为当前新型病毒代码的检测提供有效的技术支持。
[0096] 实施例二:
[0097] 本发明还提供一种基于主动学习的病毒检测终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现本发明实施例一的上述方法实施例中的步骤。
[0098] 进一步地,作为一个可执行方案,所述基于主动学习的病毒检测终端设备可以是桌上型计算机、笔记本、掌上电脑及服务器等计算设备。所述基于主动学习的病毒检测终端设备可包括,但不仅限于,处理器、存储器。本领域技术人员可以理解,上述基于主动学习的病毒检测终端设备的组成结构仅仅是基于主动学习的病毒检测终端设备的示例,并不构成对基于主动学习的病毒检测终端设备的限定,可以包括比上述更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述基于主动学习的病毒检测终端设备还可以包括输入输出设备、网络接入设备、总线等,本发明实施例对此不做限定。
[0099] 进一步地,作为一个可执行方案,所称处理器可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等,所述处理器是所述基于主动学习的病毒检测终端设备的控制中心,利用各种接口和线路连接整个基于主动学习的病毒检测终端设备的各个部分。
[0100] 所述存储器可用于存储所述计算机程序和/或模,所述处理器通过运行或执行存储在所述存储器内的计算机程序和/或模块,以及调用存储在存储器内的数据,实现所述基于主动学习的病毒检测终端设备的各种功能。所述存储器可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序;存储数据区可存储根据手机的使用所创建的数据等。此外,存储器可以包括高速随机存取存储器,还可以包括非易失性存储器,例如硬盘、内存、插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
[0101] 本发明还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现本发明实施例上述方法的步骤。
[0102] 所述基于主动学习的病毒检测终端设备集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)以及软件分发介质等。
[0103] 尽管结合优选实施方案具体展示和介绍了本发明,但所属领域的技术人员应该明白,在不脱离所附权利要求书所限定的本发明的精神和范围内,在形式上和细节上可以对本发明做出各种变化,均为本发明的保护范围。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈