首页 / 专利库 / 软件 / 网络机器人 / 网络爬虫 / 一种公网资产的识别方法、装置及存储介质

一种公网资产的识别方法、装置及存储介质

阅读:899发布:2020-05-08

专利汇可以提供一种公网资产的识别方法、装置及存储介质专利检索,专利查询,专利分析的服务。并且本 发明 公开了一种公网资产的识别方法、装置及存储介质,用以解决 现有技术 中存在的公网资产的识别效率较低的技术问题,该方法包括:基于预设关键字,从资产库中识别出疑似企业资产;其中,资产库中存储有从公网中获取的网络资产,预设关键字为与企业信息相关的关键字,疑似企业资产为网络上可能属于企业的网络资产;利用 网络爬虫 ,对疑似企业资产进行深层信息爬取,获得疑似企业资产对应的第一网络指纹信息;其中,第一网络指纹信息为能表征疑似企业资产对应的网页的基本特征的信息;判断第一网络指纹信息中是否存在预设关键字,从存在预设关键字的第一网络指纹信息中提取域名资产和网址资产,将域名资产和网址资产确定为企业资产。,下面是一种公网资产的识别方法、装置及存储介质专利的具体信息内容。

1.一种公网资产的识别方法,其特征在于,包括:
基于预设关键字,从资产库中识别出疑似企业资产;其中,所述资产库中存储有从公网中获取的网络资产,所述预设关键字为与企业信息相关的关键字,所述疑似企业资产为网络上可能属于企业的网络资产;
利用网络爬虫,对所述疑似企业资产进行深层信息爬取,获得所述疑似企业资产对应的第一网络指纹信息;其中,所述第一网络指纹信息为能表征所述疑似企业资产对应的网页的基本特征的信息;
判断所述第一网络指纹信息中是否存在所述预设关键字,从存在所述预设关键字的第一网络指纹信息中提取域名资产和网址资产,将所述域名资产和网址资产确定为企业资产。
2.如权利要求1所述的识别方法,其特征在于,基于预设关键字,从资产库中识别出疑似企业资产,包括:
对所述资产库中每个网络资产执行以下操作:
判断所述每个网络资产对应的第二网页信息及第二网络指纹信息中,是否存在所述预设关键字;
若为是,从所述第二网页信息及所述第二网络指纹信息中,提取第一域名资产和第一网址资产;
将所有第一域名资产和第一网址资产作为所述疑似企业资产。
3.如权利要求2所述的识别方法,其特征在于,判断所述每个网络资产对应的第二网页信息及第二网络指纹信息中,是否存在所述预设关键字,包括:
判断所述每个网络资产中的域名、所述域名的备案信息和whois信息、网址对应的第二网页信息及第二网络指纹信息中,是否存在所述预设关键字。
4.如权利要求1所述的识别方法,其特征在于,所述资产库中的网络资产是通过分布式部署的网络爬虫从所述公网中爬取的。
5.如权利要求1-4任一项所述的识别方法,其特征在于,利用网络爬虫,对所述疑似企业资产进行深层信息爬取,获得所述疑似企业资产对应的第一网络指纹信息,包括:
将所述疑似企业资产的主域名和子域名对应网页的URL存入待扫描队列;
对所述待扫描队列中的URL进行web指纹识别,获取所述第一网络指纹信息。
6.如权利要求5所述的识别方法,其特征在于,从存在所述预设关键字的第一网络指纹信息中提取域名资产和网址资产之后,还包括:
获取并存储所述域名资产下的相关信息;其中,所述相关信息为所述域名资产下的网页跳转信息;
将所述相关信息作为所述企业资产的间接关联资产。
7.如权利要求5所述的识别方法,其特征在于,将所述域名资产和网址资产确定为企业资产之后,还包括:
基于预设险信息,对所述企业资产进行风险识别;其中,所述预设风险信息包括所述企业资产对应网页的访问量超过设定阈值,所述企业资产中的高危端口,所述企业资产中的存在的漏洞,及所述企业资产中的不良信息;
当识别出任一企业资产存在风险时,发送警示信息。
8.如权利要求5所述的识别方法,其特征在于,将所述域名资产和网址资产确定为企业资产之后,还包括:
对所述企业资产进行监控,在所述企业资产生送变化时,更新所述企业资产;
对所述疑似企业资产进行定期扫描,将扫描结果中确定为企业资产的疑似资产剔除。
9.一种公网资产的识别装置,其特征在于,包括:
识别单元,用于基于预设关键字,从资产库中识别出疑似企业资产;其中,所述资产库中存储有从公网中获取的网络资产,所述预设关键字为与企业信息相关的关键字,所述疑似企业资产为网络上可能属于企业的网络资产;
获得单元,用于利用网络爬虫,对所述疑似企业资产进行深层信息爬取,获得所述疑似企业资产对应的第一网络指纹信息;其中,所述第一网络指纹信息为能表征所述疑似企业资产对应的网页的基本特征的信息
确定单元,用于判断所述第一网络指纹信息中是否存在所述预设关键字,从存在所述预设关键字的第一网络指纹信息中提取域名资产和网址资产,将所述域名资产和网址资产确定为企业资产。
10.一种公网资产的识别装置,其特征在于,包括:
至少一个处理器,以及
与所述至少一个处理器连接的存储器
其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述至少一个处理器通过执行所述存储器存储的指令,执行如权利要求1-8任一项所述的方法。
11.一种计算机可读存储介质,其特征在于:
所述计算机可读存储介质存储有计算机指令,当所述计算机指令在计算机上运行时,使得计算机执行如权利要求1-8中任一项所述的方法。

说明书全文

一种公网资产的识别方法、装置及存储介质

技术领域

[0001] 本发明涉及互联网领域,尤其是涉及一种公网资产的识别方法、装置及存储介质。

背景技术

[0002] 随着互联网技术的飞速发展,企业部署在公网上的业务越来越多,也越来越复杂,这使得企业暴露在公网上的资产也越来越多,进而导致企业对其公网资产的管理难度也越来越大,面临的安全险也日益增大。
[0003] 如果企业不能对这些公网资产进行有效的管控,一方面容易产生大量的僵尸资产,使资源不能得到有效利用造成浪费,另一方面这些资产可能因为疏于维护成为外界对内攻击的重要切入点,甚至被篡改变成一些恶意信息的散播者,从而为企业安全带来极大的隐患。
[0004] 在现有技术中,通常采用两种方式对企业的公网资产进行管理,一种为采用人工统计的方式,定期对公网资产进行统计;另一种则是利用扫描软件,识别企业的公网资产。然而,采用人工统计的方式管理公网资产,往往容易产生遗漏和错误,且手工添加效率低;
采用扫描软件的方式识别公网资产,有存在获取信息不够全面、效率低的问题。
[0005] 鉴于此,如何有效的提高公网资产的识别效率,成为一个亟待解决的技术问题。

发明内容

[0006] 本发明提供一种公网资产的识别方法、装置及存储介质,用以解决现有技术中存在的公网资产的识别效率较低的技术问题。
[0007] 第一方面,为解决上述技术问题,本发明实施例提供的一种公网资产识别方法的技术方案如下:
[0008] 基于预设关键字,从资产库中识别出疑似企业资产;其中,所述资产库中存储有从公网中获取的网络资产,所述预设关键字为与企业信息相关的关键字,所述疑似企业资产为网络上可能属于企业的网络资产;
[0009] 利用网络爬虫,对所述疑似企业资产进行深层信息爬取,获得所述疑似企业资产对应的第一网络指纹信息;其中,所述第一网络指纹信息为能表征所述疑似企业资产对应的网页的基本特征的信息;
[0010] 判断所述第一网络指纹信息中是否存在所述预设关键字,从存在所述预设关键字的第一网络指纹信息中提取域名资产和网址资产,将所述域名资产和网址资产确定为企业资产。
[0011] 可选的,基于预设关键字,从资产库中识别出疑似企业资产,包括:
[0012] 对所述资产库中每个网络资产执行以下操作:
[0013] 判断所述每个网络资产对应的第二网页信息及第二网络指纹信息中,是否存在所述预设关键字;
[0014] 若为是,从所述第二网页信息及所述第二网络指纹信息中,提取第一域名资产和第一网址资产;
[0015] 将所有第一域名资产和第一网址资产作为所述疑似企业资产。
[0016] 可选的,判断所述每个网络资产对应的第二网页信息及第二网络指纹信息中,是否存在所述预设关键字,包括:
[0017] 判断所述每个网络资产中的域名、所述域名的备案信息和whois信息、网址对应的第二网页信息及第二网络指纹信息中,是否存在所述预设关键字。
[0018] 可选的,所述资产库中的网络资产是通过分布式部署的网络爬虫从所述公网中爬取的。
[0019] 可选的,利用网络爬虫,对所述疑似企业资产进行深层信息爬取,获得所述疑似企业资产对应的第一网络指纹信息,包括:
[0020] 将所述疑似企业资产的主域名和子域名对应网页的URL存入待扫描队列;
[0021] 对所述待扫描队列中的URL进行web指纹识别,获取所述第一网络指纹信息。
[0022] 可选的,从存在所述预设关键字的第一网络指纹信息中提取域名资产和网址资产之后,还包括:
[0023] 获取并存储所述域名资产下的相关信息;其中,所述相关信息为所述域名资产下的网页跳转信息;
[0024] 将所述相关信息作为所述企业资产的间接关联资产。
[0025] 可选的,将所述域名资产和网址资产确定为企业资产之后,还包括:
[0026] 基于预设风险信息,对所述企业资产进行风险识别;其中,所述预设风险信息包括所述企业资产对应网页的访问量超过设定阈值,所述企业资产中的高危端口,所述企业资产中的存在的漏洞,及所述企业资产中的不良信息;
[0027] 当识别出任一企业资产存在风险时,发送警示信息。
[0028] 可选的,将所述域名资产和网址资产确定为企业资产之后,还包括:
[0029] 对所述企业资产进行监控,在所述企业资产生送变化时,更新所述企业资产;
[0030] 对所述疑似企业资产进行定期扫描,将扫描结果中确定为企业资产的疑似资产剔除。
[0031] 第二方面,本发明实施例提供了一种用于公网资产的识别装置,包括:
[0032] 识别单元,用于基于预设关键字,从资产库中识别出疑似企业资产;其中,所述资产库中存储有从公网中获取的网络资产,所述预设关键字为与企业信息相关的关键字,所述疑似企业资产为网络上可能属于企业的网络资产;
[0033] 获得单元,用于利用网络爬虫,对所述疑似企业资产进行深层信息爬取,获得所述疑似企业资产对应的第一网络指纹信息;其中,所述第一网络指纹信息为能表征所述疑似企业资产对应的网页的基本特征的信息。
[0034] 确定单元,用于判断所述第一网络指纹信息中是否存在所述预设关键字,从存在所述预设关键字的第一网络指纹信息中提取域名资产和网址资产,将所述域名资产和网址资产确定为企业资产。
[0035] 可选的,所述识别单元用于:
[0036] 对所述资产库中每个网络资产执行以下操作:
[0037] 判断所述每个网络资产对应的第二网页信息及第二网络指纹信息中,是否存在所述预设关键字;
[0038] 若为是,从所述第二网页信息及所述第二网络指纹信息中,提取第一域名资产和第一网址资产;
[0039] 将所有第一域名资产和第一网址资产作为所述疑似企业资产。
[0040] 可选的,所述识别单元还用于:
[0041] 判断所述每个网络资产中的域名、所述域名的备案信息和whois信息、网址对应的第二网页信息及第二网络指纹信息中,是否存在所述预设关键字。
[0042] 可选的,所述资产库中的网络资产是通过分布式部署的网络爬虫从所述公网中爬取的。
[0043] 可选的,所述获得单元用于:
[0044] 将所述疑似企业资产的主域名和子域名对应网页的URL存入待扫描队列;
[0045] 对所述待扫描队列中的URL进行web指纹识别,获取所述第一网络指纹信息。
[0046] 可选的,所述确定单元还用于:
[0047] 获取并存储所述域名资产下的相关信息;其中,所述相关信息为所述域名资产下的网页跳转信息;
[0048] 将所述相关信息作为所述企业资产的间接关联资产。
[0049] 可选的所述确定单元还用于:
[0050] 基于预设风险信息,对所述企业资产进行风险识别;其中,所述预设风险信息包括所述企业资产对应网页的访问量超过设定阈值,所述企业资产中的高危端口,所述企业资产中的存在的漏洞,及所述企业资产中的不良信息;
[0051] 当识别出任一企业资产存在风险时,发送警示信息。
[0052] 可选的,所述确定单元还用于:
[0053] 对所述企业资产进行监控,在所述企业资产生送变化时,更新所述企业资产;
[0054] 对所述疑似企业资产进行定期扫描,将扫描结果中确定为企业资产的疑似资产剔除。
[0055] 第三方面,本发明实施例还提供一种用于公网资产的识别装置,包括:
[0056] 至少一个处理器,以及
[0057] 与所述至少一个处理器连接的存储器
[0058] 其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述至少一个处理器通过执行所述存储器存储的指令,执行如上述第一方面所述的方法。
[0059] 第四方面,本发明实施例还提供一种计算机可读存储介质,包括:
[0060] 所述计算机可读存储介质存储有计算机指令,当所述计算机指令在计算机上运行时,使得计算机执行如上述第一方面所述的方法。
[0061] 通过本发明实施例的上述一个或多个实施例中的技术方案,本发明实施例至少具有如下技术效果:
[0062] 在本发明提供的实施例中,通过预设关键字,从资产库中识别出疑似企业资产,再利用网络爬虫,对疑似企业资产进行深层信息爬取,获得疑似企业资产对应的第一网络指纹信息,之后通过判断第一网络指纹信息中是否存在预设关键字来对疑似企业资产进行二次印证,印证成功(即判断结果为是)便从存在预设关键字的第一网络指纹信息中提取域名资产和网址资产,将域名资产和网址资产确定为企业资产。从而能够快速、高效的从公网中识别出企业存在于公网中的网络资产。附图说明
[0063] 图1为本发明实施例提供的一种公网资产识别方法的流程图
[0064] 图2为本发明实施例提供的一种公网资产识别装置的结构示意图。

具体实施方式

[0065] 本发明实施列提供一种公网资产的识别方法、装置及存储介质,以解决现有技术中存在的公网资产的识别效率较低的技术问题。
[0066] 本申请实施例中的技术方案为解决上述的技术问题,总体思路如下:
[0067] 提供一种公网资产的识别方法,包括:基于预设关键字,从资产库中识别出疑似企业资产;其中,资产库中存储有从公网中获取的网络资产,预设关键字为与企业信息相关的关键字,疑似企业资产为网络上可能属于企业的网络资产;利用网络爬虫,对疑似企业资产进行深层信息爬取,获得疑似企业资产对应的第一网络指纹信息;其中,第一网络指纹信息为能表征疑似企业资产对应的网页的基本特征的信息;判断第一网络指纹信息中是否存在预设关键字,从存在预设关键字的第一网络指纹信息中提取域名资产和网址资产,将域名资产和网址资产确定为企业资产。
[0068] 由于在上述方案中,通过预设关键字,从资产库中识别出疑似企业资产,再利用网络爬虫,对疑似企业资产进行深层信息爬取,获得疑似企业资产对应的第一网络指纹信息,之后通过判断第一网络指纹信息中是否存在预设关键字来对疑似企业资产进行二次印证,印证成功(即判断结果为是)便从存在预设关键字的第一网络指纹信息中提取域名资产和网址资产,将域名资产和网址资产确定为企业资产。从而能够快速、高效的从公网中识别出企业存在于公网中的网络资产。
[0069] 为了更好的理解上述技术方案,下面通过附图以及具体实施例对本发明技术方案做详细的说明,应当理解本发明实施例以及实施例中的具体特征是对本发明技术方案的详细的说明,而不是对本发明技术方案的限定,在不冲突的情况下,本发明实施例以及实施例中的技术特征可以相互组合。
[0070] 请参考图1,本发明实施例提供一种公网资产的识别方法,该识别方法的处理过程如下。
[0071] 步骤101:基于预设关键字,从资产库中识别出疑似企业资产;其中,资产库中存储有从公网中获取的网络资产,预设关键字为与企业信息相关的关键字,疑似企业资产为网络上可能属于企业的网络资产。
[0072] 在执行步骤101之前,需要先构建一个资产库,该资产库由域名库、URL库、漏洞信息库构成。
[0073] 在构建域名库时,是通过分布式部署的网络爬虫,从全球网络中爬取的网络资产构成的,网络爬虫可以对常见域名库中的域名进行爬取,还可以从域名备案信息及whois信息中爬取,同时还可以接收人工录入的方式得到域名资产,通过这些方式可以保障资产库内域名原始资源的丰富性,而对网络爬虫采用分布式的部署方式,能够极大的提高信息的获取效率。
[0074] 在本发明提供的实施例中,在构建域名库时采取了识别域名备案、whois信息的方法,避免因网站信息不够明确或所含业务关联较小而错失疑似企业资产,使结果更加准确。
[0075] 网络爬虫在进行信息爬取时,利用获得的主域名页面中的链接进行广度优先式的爬取,可以发现更多的子链接,进而获取该域名下对应的更多链接、web指纹数据;从这些爬取到的信息中提取域名对应的子域名资产,可以进一步的使资产库中的原始资源更丰富。
[0076] 在获取子域名时,不仅可以采用页面信息提取的方式,还可以采用从DNS流量中进行匹配、字典穷举等方式获取子域名,还可以通过子域名查询站点检索的方式,获取更多的子域名。
[0077] URL库是采用分布式部署的网络爬虫对全球的URL信息进行爬取,并且对已获取的网络页面中的URL还会继续进行广度优先式的爬取,以获取更多更全面的URL资产,进而构成URL库。
[0078] 漏洞信息库是通过网络爬虫爬取CVE漏洞库、CNNVD(中国国家信息安全漏洞库)、NVD(美国国家信息安全漏洞库)中的数据,以及接受人工采集漏洞信息的方式构建成功的。
[0079] 在本发明提供的实施例中,需要理解的是上述资产库并非一次形成的,而是在实际使用的过程中还会不定期对上述资产库进行更新。
[0080] 在本发明提供的实施例中,通过分布式部署网络爬虫爬取信息,一方面可以分担各个点的压,提升获取信息的效率,另一方面也方便各个节点实时更新数据、识别数据,无需等待,资产出现变化可立刻获取。
[0081] 在构建成上述资产库之后,便可执行步骤101。
[0082] 通过事先设置好的与企业信息相关的关键字(即预设关键字),从资产库中识别出疑似企业资产。
[0083] 具体的,对资产库中每个网络资产执行以下操作:
[0084] 判断每个网络资产对应的第二网页信息及第二网络指纹信息中,是否存在预设关键字;若为是,从第二网页信息及第二网络指纹信息中,提取第一域名资产和第一网址资产;将所有第一域名资产和第一网址资产作为疑似企业资产。
[0085] 例如,资产库中的一域名为xxxmmm,判断该域名的第二网页信息(即www.xxxmmm.com的网页信息),及对应的web指纹信息(即第二网络指纹信息)中是否存在预设关键字(健康),若存在,则从www.xxxmmm.com的网页信息及对应的web指纹信息中提取第一域名资产(即xxxmmm)和第一网址资产,假设www.xxxmmm.com对应的IP为192.168.5.9,则第一网址资产为192.168.5.9,若www.xxxmmm.com下还有子域名,则将对应的子域名、对应IP地址也提取出来,分别作为第一域名资产、第一网址资产的内容,最后将所有的第一域名资产、第一网址资产作为疑似企业资产。
[0086] 判断每个网络资产对应的第二网页信息及第二网络指纹信息中,是否存在预设关键字,可以采用下列方式:
[0087] 判断每个网络资产中的域名、域名的备案信息和whois信息、网址对应的第二网页信息及第二网络指纹信息中,是否存在预设关键字。
[0088] 在本发明提供的实施例中,预设关键字支持多级关键字的识别,一些企业可能下属单位较多,识别较复杂,这时采用多级别关键字进行识别能够更好的适应客户的需求,如预设关键字为健康/某城市(XXX企业所在城市),即匹配出某城市下与健康相关的网络资产。
[0089] 在本发明提供的实施例中,在构建疑似企业资产时,利用层级式的方式进行信息爬取,不局限于原始页面的内容,获取的信息更全面、更丰富,能够识别出的资产也会更加完整。
[0090] 在获得疑似企业资产后,便可执行步骤102。
[0091] 步骤102:利用网络爬虫,对疑似企业资产进行深层信息爬取,获得疑似企业资产对应的第一网络指纹信息;其中,第一网络指纹信息为能表征疑似企业资产对应的网页的基本特征的信息。
[0092] 在获得疑似企业资产后,还需要进一步对疑似企业资产进行验证,通过验证的疑似企业资产才能被确定为企业资产。具体的,可以通过网络爬虫,对疑似企业资产进行深层信息爬取,获得疑似企业资产对应的第一网络指纹信息,并判断第一网络指纹信息中是否存在预设关键字来确定其是否为企业资产。
[0093] 利用网络爬虫,对疑似企业资产进行深层信息爬取,获得疑似企业资产对应的第一网络指纹信息,需要先将疑似企业资产的主域名和子域名对应网页的URL存入待扫描队列;再对待扫描队列中的URL进行web指纹识别,获取第一网络指纹信息。
[0094] 需要说明的是,在获取web指纹信息(即第一网络指纹信息)的过程中,需要对链接进行去重处理,即同一域名下已爬取过的页面不再进行二次爬取,这样可以有效避免造成循环、浪费资源。
[0095] 从存在预设关键字的第一网络指纹信息中提取域名资产和网址资产之后,还包括:
[0096] 获取并存储域名资产下的相关信息;其中,相关信息为域名资产下的网页跳转信息;并将相关信息作为企业资产的间接关联资产。
[0097] 例如,当某一主域名/子域名与预设关键字相匹配时,其它属于同一主域名下的信息也要进行保留,作为企业的间接关联资产。
[0098] 在获得疑似企业资产对应的第一网络指纹信息之后,便可执行步骤103。
[0099] 步骤103:判断第一网络指纹信息中是否存在预设关键字,从存在预设关键字的第一网络指纹信息中提取域名资产和网址资产,将域名资产和网址资产确定为企业资产。
[0100] 在获得疑似企业资产对应的第一网络指纹信息之后,判断第一网络指纹信息中是否存在预设关键字,若存在则确定该疑似企业资产为正确的企业资产,进而从存在预设关键字的第一网络指纹信息中提取域名资产和网址资产,将域名资产和网址资产确定为企业资产。
[0101] 在提取网址资产时,还可以通过域名获取更多的网址。
[0102] 例如,对获取到的域名和子域名进行实时DNS解析,并根据域名归属动态使用相应地区的DNS服务器;对于热域名(如一定期间内域名访问量达到设定阈值或子域名数量达到设定阈值)的域名进行重点关注,重复解析,从而解析出多个为该域名服务的IP。
[0103] 对获取到的IP进行自动扫描,弹性部署主机决定并发数,这样可以在短期内完成对大量公网资产的核查;还可以基于端口,同时扫描多个IP,这样可以提升扫描效率。
[0104] 当端口有web服务时,判断是否有跳转链接,并判断跳转后链接的资产相关性,以获取更多相关资产。
[0105] 由于IP的信息比较全面,开放端口、协议扫描IP外,还可以对地理定位、所属运营商、威胁恶意信息等均进行获取。
[0106] 在本发明提供的实施例中,在基于预设关键字,从资产库中识别出疑似企业资产(主域名、子域名、IP信息)后,会进行二次确认(判断第一网络指纹信息中是否存在预设关键字)和重点关注(深层信息爬取,热点域名重点解析,IP开放web服务爬取),这样可以使获取的网络资产更全面,更彻底。
[0107] 将域名资产和网址资产确定为企业资产之后,还包括:
[0108] 基于预设风险信息,对企业资产进行风险识别;其中,预设风险信息包括企业资产对应网页的访问量超过设定阈值,企业资产中的高危端口,企业资产中的存在的漏洞,及企业资产中的不良信息;当识别出任一企业资产存在风险时,发送警示信息。
[0109] 预设风险信息为企业资产对应网页的访问量超过设定阈值时,其表现为服务端口、web指纹信息等出现超过设定阈值的规模变化,此时确定相应的企业资产存在风险,向相关人员发送警示信息,并随时进行监控。
[0110] 预设风险信息为高危端口时,可以根据扫描获得的IP指纹数据,对IP开放的高危端口及对应协议进行识别,若确定存在风险,发送警示信息。
[0111] 预设风险信息为漏洞时,将获得的企业资产对应的扫描数据与漏洞库中的信息进行匹配,若匹配成功确定存在漏洞,发送警示信息。
[0112] 预设风险信息为不良信息时,根据获取的企业资产对应的IP和域名下属的网站内容,判断其是否为钓鱼网站或含有黄赌毒等不良信息,若判断结果为存在不良信息,则发送警示信息。
[0113] 将域名资产和网址资产确定为企业资产之后,还包括:
[0114] 对企业资产进行监控,在企业资产生送变化时,更新企业资产。
[0115] 管理并储存识别出的企业资产,如域名、子域名、IP资产信息及其历史信息。对企业资产进行定期重新扫描,在扫描时法线企业资产发生了变化需要及时更新,如原来以域名被确定为企业资产,但由于某种原因该域名实际已没用了,通过扫描确定该域名已不是企业资产,此时需将其从企业资产中移除。
[0116] 对疑似企业资产进行定期扫描,将扫描结果中确定为企业资产的疑似资产剔除。
[0117] 对那些曾被认为是疑似企业资产的公网资产进行关注,便于发现新的企业资产。例如,对疑似企业资产定期重新扫描,根据扫描结果重新确定其中是否有企业资产,如有将其更新为企业资产,若对疑似资产中多次扫描后都确定其不是企业资产可以将其更新为无关资产,或继续关注。
[0118] 进一步的,可以根据实时变化的情况,输出扫描时出现的新增/减少的企业资产、服务变化等资产变化提示。
[0119] 还可以输出资产核查报告,综合以上获取的实时IP和域名信息、资产变动信息以及相关的风险分析结果,生成相应的完整数据报告。
[0120] 基于同一发明构思,本发明一实施例中提供一种用于公网资产识别的装置,该装置的公网资产识别方法的具体实施方式可参见方法实施例部分的描述,重复之处不再赘述,请参见图2,该装置包括:
[0121] 识别单元201,用于基于预设关键字,从资产库中识别出疑似企业资产;其中,所述资产库中存储有从公网中获取的网络资产,所述预设关键字为与企业信息相关的关键字,所述疑似企业资产为网络上可能属于企业的网络资产;
[0122] 获得单元202,用于利用网络爬虫,对所述疑似企业资产进行深层信息爬取,获得所述疑似企业资产对应的第一网络指纹信息;其中,所述第一网络指纹信息为能表征所述疑似企业资产对应的网页的基本特征的信息。
[0123] 确定单元203,用于判断所述第一网络指纹信息中是否存在所述预设关键字,从存在所述预设关键字的第一网络指纹信息中提取域名资产和网址资产,将所述域名资产和网址资产确定为企业资产。
[0124] 可选的,所述识别单元201用于:
[0125] 对所述资产库中每个网络资产执行以下操作:
[0126] 判断所述每个网络资产对应的第二网页信息及第二网络指纹信息中,是否存在所述预设关键字;
[0127] 若为是,从所述第二网页信息及所述第二网络指纹信息中,提取第一域名资产和第一网址资产;
[0128] 将所有第一域名资产和第一网址资产作为所述疑似企业资产。
[0129] 可选的,所述识别单元201还用于:
[0130] 判断所述每个网络资产中的域名、所述域名的备案信息和whois信息、网址对应的第二网页信息及第二网络指纹信息中,是否存在所述预设关键字。
[0131] 可选的,所述资产库中的网络资产是通过分布式部署的网络爬虫从所述公网中爬取的。
[0132] 可选的,所述获得单元202用于:
[0133] 将所述疑似企业资产的主域名和子域名对应网页的URL存入待扫描队列;
[0134] 对所述待扫描队列中的URL进行web指纹识别,获取所述第一网络指纹信息。
[0135] 可选的,所述确定单元203还用于:
[0136] 获取并存储所述域名资产下的相关信息;其中,所述相关信息为所述域名资产下的网页跳转信息;
[0137] 将所述相关信息作为所述企业资产的间接关联资产。
[0138] 可选的所述确定单元203还用于:
[0139] 基于预设风险信息,对所述企业资产进行风险识别;其中,所述预设风险信息包括所述企业资产对应网页的访问量超过设定阈值,所述企业资产中的高危端口,所述企业资产中的存在的漏洞,及所述企业资产中的不良信息;
[0140] 当识别出任一企业资产存在风险时,发送警示信息。
[0141] 可选的,所述确定单元203还用于:
[0142] 对所述企业资产进行监控,在所述企业资产生送变化时,更新所述企业资产;
[0143] 对所述疑似企业资产进行定期扫描,将扫描结果中确定为企业资产的疑似资产剔除。
[0144] 基于同一发明构思,本发明实施例中提供了一种用于公网资产识别的装置,包括:至少一个处理器,以及
[0145] 与所述至少一个处理器连接的存储器;
[0146] 其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述至少一个处理器通过执行所述存储器存储的指令,执行如上所述的公网资产识别方法。
[0147] 基于同一发明构思,本发明实施例还提一种计算机可读存储介质,包括:
[0148] 所述计算机可读存储介质存储有计算机指令,当所述计算机指令在计算机上运行时,使得计算机执行如上所述的公网资产识别方法。
[0149] 在本发明提供的实施例中,通过预设关键字,从资产库中识别出疑似企业资产,再利用网络爬虫,对疑似企业资产进行深层信息爬取,获得疑似企业资产对应的第一网络指纹信息,之后通过判断第一网络指纹信息中是否存在预设关键字来对疑似企业资产进行二次印证,印证成功(即判断结果为是)便从存在预设关键字的第一网络指纹信息中提取域名资产和网址资产,将域名资产和网址资产确定为企业资产。从而能够快速、高效的从公网中识别出企业存在于公网中的网络资产。
[0150] 本领域内的技术人员应明白,本发明实施例可提供为方法、系统、或计算机程序产品。因此,本发明实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
[0151] 本发明实施例是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
[0152] 这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
[0153] 这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
[0154] 显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈