技术领域
[0001] 本
发明涉及大数据信息匹配技术领域,具体为一种基于大数据的关键信息内容匹配识别的方法。
背景技术
[0002] 随着
云时代的来临,大数据也吸引了越来越多的关注,大数据是指以多元形式,自许多来源搜集而来的庞大数据组,往往具有实时性,由人类日益普及的网络行为所伴生,从海量数据中提取出有用的信息,这对网络架构和
数据处理能
力而言也是巨大的挑战,大数据就是互联网发展到现今阶段的一种表象或特征,基于大数据的关键信息内容匹配识别的方法对于准确提取出有用的信息至关重要,简言之,从各种各样类型的数据中,快速获得有价值信息的能力,就是大数据技术,大数据最核心的价值就是在于对于海量数据进行存储和分析,相比起现有的其他技术而言,大数据的廉价、迅速和优化这三方面的综合成本是最优的,正是这一点促使该技术具备走向众多企业的潜力。
[0003] 现有针对大数据的关键信息内容在匹配识别时通常识别度不是很高,通过
关键词识别的匹配信息范围较广且内容较多,增大了用户筛选出有用信息的工作量。
发明内容
[0004] (一)解决的技术问题
[0005] 针对
现有技术的不足,本发明提供了一种基于大数据的关键信息内容匹配识别的方法,解决了现有大数据技术针对大数据的关键信息内容在匹配识别时,通过关键词识别的匹配信息范围较广且内容较多,增大了用户筛选出有用信息难度的问题。
[0006] (二)技术方案
[0007] 为实现上述目的,本发明提供如下技术方案:一种基于大数据的关键信息内容匹配识别的方法,包括
访问信息、数据分析
服务器、
数据库和云端,所述访问信息的输出端与信息清理模
块的输入端电连接,所述访问信息和信息清理模块的输出端均与输入模块一的输入端电连接。
[0008] 所述数据分析服务器包括数据收集模块、数据分析模块、数据检测模块、数据分类模块和数据存储模块,所述输入模块一的输出端与数据收集模块的输入端电连接,所述数据收集模块的输出端与数据分析模块的输入端电连接,所述数据分析模块的输出端与数据检测模块的输入端电连接,所述数据检测模块的输出端与杀毒系统的输入端电连接,所述杀毒系统的输出端与
中央处理器的输入端电连接,所述数据检测模块的输出端与数据分类模块的输入端电连接,所述数据分类模块的输出端与数据存储模块的输入端电连接,所述数据存储模块的输出端与中央处理器的输入端电连接,所述中央处理器与显示模块双向电连接。
[0009] 所述数据库包括检索模块和存储模块,所述检索模块与存储模块双向电连接,所述检索模块的输出端与中央处理器的输入端电连接,所述中央处理器的输出端与通信模块的输入端电连接,所述通信模块的输出端与检索模块的输入端电连接。
[0010] 所述
搜索引擎包括输入模块二、信息采集单元、信息分类单元、信息存储单元和输出模块,所述检索模块的输出端与输入模块一的输入端电连接,所述输入模块二的输出端与信息采集单元的输入端电连接,所述信息采集单元的输出端与信息分类单元的输入端电连接,所述信息分类单元的输出端与信息存储单元的输入端电连接,所述信息存储单元的输出端与输出模块的输入端电连接,所述输出模块的输出端与检索模块的输入端电连接,所述信息采集单元与云端双向电连接。
[0011] 一种基于大数据的关键信息内容匹配识别的方法,包括如下步骤:
[0012] S1、输入访问信息启动信息清理模块,信息清理模块将输入模块一内的前次访问信息清除,在输入模块一的对话框内输入访问信息访问网络空间。
[0013] S2、数据分析服务器拦截访问信息,数据收集模块对采集访问信息,通过数据分析模块分析访问信息的属性和内容是否符合网络健康安全标准,数据检测模块检测访问信息是否具有访问权限,若不具有访问权限,则通过杀毒系统将其拦截后屏蔽,杀毒系统将屏蔽结果传送到中央处理器,中央处理器通过显示模块显示无搜索结果,若具有访问权限,数据检测模块将检测后的访问信息传送给数据分类模块,按照访问信息的属性和关键词分类,将其存储在数据存储模块内,存储完毕中央处理器执行命令。
[0014] S3、中央处理器通过通信模块与数据库通信,检索模块检索采集存储模块内的存储数据,若数据库内存储相关访问信息的访问内容,存储模块即将访问内容通过检索模块反馈给中央处理器,中央处理器将访问内容传输到显示模块。
[0015] S4、若数据库内没有存储相关访问信息的访问内容,存储模块通过检索模块向搜索引擎的输入模块二发出命令,输入模块二向信息采集单元发送命令搜集云端的相关访问信息的访问内容,云端将访问内容反馈给信息采集单元并通过信息分类单元分类,即可将该访问内容储存在搜索引擎的信息存储单元内,便于下次搜索时直接访问,信息存储单元通过输出模块向检索模块执行命令,检索模块将访问内容传送给中央处理器,中央处理器通过显示模块向用户显示访问信息的相关访问内容。
[0016] 优选的,所述存储模块包括信息存储单元一和信息存储单元二。
[0017] 优选的,所述中央处理器包括诊断模块和传输模块,所述诊断模块的输出端与传输模块的输入端电连接。
[0018] 优选的,所述杀毒系统为上网过滤
软件的信息屏蔽系统。
[0019] 优选的,所述输入模块一为输入信息关键字的对话框。
[0020] (三)有益效果
[0021] 本发明提供了一种基于大数据的关键信息内容匹配识别的方法,具备以下有益效果:
[0022] 本发明通过设置数据分析服务器、数据库、信息清理模块、杀毒系统和中央处理器,当访问信息访问网络空间时,通过数据检测模块判断是否为具有访问权限的信息,通过杀毒系统屏蔽不具有访问权限的访问信息,当前一次输入模块一内的访问信息未通过信息清理模块清除,则本次的访问信息若在上次访问信息的集合范围内,则本次的访问信息的访问范围则基于上次的访问信息范围之内,使本次的访问信息的访问范围缩小,达到了自动缩小访问信息的访问范围效果,无需缩小访问范围时即可通过信息清理模块清除上次访问信息内容即可,访问信息的访问内容通过中央处理器和通信模块从数据库内获取,若数据库内没有检索到相关信息即可从云端内获取,且数据库具有自动学习能力,将从云端获取的访问信息的访问内容分类自动通过存储模块存储,便于下次检索,为下次检索相同访问信息节约了时间,达到了缩小用户筛选有用信息范围,自动保存用户常用访问信息记录的目的,解决了现有大数据技术针对大数据的关键信息内容在匹配识别时,通过关键词识别的匹配信息范围较广且内容较多,增大了用户筛选出有用信息难度的问题。
附图说明
[0023] 图1为本发明系统原理示意图;
[0024] 图2为本发明数据分析服务器原理示意图;
[0025] 图3为本发明搜索引擎原理示意图;
[0026] 图4为本发明中央处理器原理示意图;
[0027] 图5为本发明存储模块原理示意图。
[0028] 图中:1访问信息、2数据分析服务器、3数据库、4云端、5信息清理模块、6输入模块一、7数据收集模块、8数据分析模块、9数据检测模块、10数据分类模块、11数据存储模块、12杀毒系统、13中央处理器、14显示模块、15检索模块、16存储模块、17通信模块、18搜索引擎、19输入模块二、20信息采集单元、21信息分类单元、22信息存储单元、23输出模块、24信息存储单元一、25信息存储单元二、26诊断模块、27传输模块。
具体实施方式
[0029] 下面将结合本发明
实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0030] 如图1-5所示,本发明提供一种技术方案:一种基于大数据的关键信息内容匹配识别的方法,包括访问信息1、数据分析服务器2、数据库3和云端4,访问信息1的输出端与信息清理模块5的输入端电连接,访问信息1和信息清理模块5的输出端均与输入模块一6的输入端电连接,访问信息1即为用户输入的信息。
[0031] 数据分析服务器2包括数据收集模块7、数据分析模块8、数据检测模块9、数据分类模块10和数据存储模块11,输入模块一6的输出端与数据收集模块7的输入端电连接,数据收集模块7的输出端与数据分析模块8的输入端电连接,数据分析模块8的输出端与数据检测模块9的输入端电连接,数据检测模块9的输出端与杀毒系统12的输入端电连接,杀毒系统12的输出端与中央处理器13的输入端电连接,数据检测模块9的输出端与数据分类模块10的输入端电连接,数据分类模块10的输出端与数据存储模块11的输入端电连接,数据存储模块11的输出端与中央处理器13的输入端电连接,中央处理器13与显示模块14双向电连接。
[0032] 数据库3包括检索模块15和存储模块16,检索模块15与存储模块16双向电连接,检索模块15的输出端与中央处理器13的输入端电连接,中央处理器13的输出端与通信模块17的输入端电连接,通信模块17的输出端与检索模块15的输入端电连接。
[0033] 搜索引擎18包括输入模块二19、信息采集单元20、信息分类单元21、信息存储单元22和输出模块23,检索模块15的输出端与输入模块一6的输入端电连接,输入模块二19的输出端与信息采集单元20的输入端电连接,信息采集单元20的输出端与信息分类单元21的输入端电连接,信息分类单元21的输出端与信息存储单元22的输入端电连接,信息存储单元
22的输出端与输出模块23的输入端电连接,输出模块23的输出端与检索模块15的输入端电连接,信息采集单元20与云端4双向电连接。
[0034] 一种基于大数据的关键信息内容匹配识别的方法,包括如下步骤:
[0035] S1、输入访问信息1启动信息清理模块5,信息清理模块5将输入模块一6内的前次访问信息1清除,在输入模块一6的对话框内输入访问信息1访问网络空间。
[0036] S2、数据分析服务器2拦截访问信息1,数据收集模块7对采集访问信息1,通过数据分析模块8分析访问信息1的属性和内容是否符合网络健康安全标准,数据检测模块9检测访问信息1是否具有访问权限,若不具有访问权限,则通过杀毒系统12将其拦截后屏蔽,杀毒系统12将屏蔽结果传送到中央处理器13,中央处理器13通过显示模块14显示无搜索结果,若具有访问权限,数据检测模块9将检测后的访问信息1传送给数据分类模块10,按照访问信息1的属性和关键词分类,将其存储在数据存储模块11内,存储完毕中央处理器13执行命令。
[0037] S3、中央处理器13通过通信模块17与数据库3通信,检索模块15检索采集存储模块16内的存储数据,若数据库3内存储相关访问信息1的访问内容,存储模块16即将访问内容通过检索模块15反馈给中央处理器13,中央处理器13将访问内容传输到显示模块14。
[0038] S4、若数据库3内没有存储相关访问信息1的访问内容,存储模块16通过检索模块15向搜索引擎18的输入模块二19发出命令,输入模块二19向信息采集单元20发送命令搜集云端4的相关访问信息1的访问内容,云端4将访问内容反馈给信息采集单元20并通过信息分类单元21分类,即可将该访问内容储存在搜索引擎18的信息存储单元22内,便于下次搜索时直接访问,信息存储单元22通过输出模块23向检索模块15执行命令,检索模块15将访问内容传送给中央处理器13,中央处理器13通过显示模块14向用户显示访问信息1的相关访问内容。
[0039] 作为本发明的一种技术优化方案,存储模块16包括信息存储单元一24和信息存储单元二25,信息存储单元一24和信息存储单元二25分别按照信息发布时间和信息属性对数据库3内数据进行分类存储,缩短检索时间,提高检索效率。
[0040] 作为本发明的一种技术优化方案,中央处理器13包括诊断模块26和传输模块27,诊断模块26的输出端与传输模块27的输入端电连接。
[0041] 作为本发明的一种技术优化方案,杀毒系统12为上网过滤软件的信息屏蔽系统,用于屏蔽或过滤没有访问权限的访问信息1。
[0042] 作为本发明的一种技术优化方案,输入模块一6为输入信息关键字的对话框,将访问信息1输入对话框内时即可执行输入模块一6或信息清理模块5的命令,输入模块一6和信息清理模块5的命令独立执行。
[0043] 在使用时,输入访问信息1启动信息清理模块5,信息清理模块5将输入模块一6内的前次访问信息1清除,在输入模块一6的对话框内输入访问信息1访问网络空间,数据分析服务器2拦截访问信息1,数据收集模块7对采集访问信息1,通过数据分析模块8分析访问信息1的属性和内容是否符合网络健康安全标准,数据检测模块9检测访问信息1是否具有访问权限,若不具有访问权限,则通过杀毒系统12将其拦截后屏蔽,杀毒系统12将屏蔽结果传送到中央处理器13,中央处理器13通过显示模块14显示无搜索结果,若具有访问权限,数据检测模块9将检测后的访问信息1传送给数据分类模块10,按照访问信息1的属性和关键词分类,将其存储在数据存储模块11内,存储完毕中央处理器13执行命令,中央处理器13通过通信模块17与数据库3通信,检索模块15检索采集存储模块16内的存储数据,若数据库3内存储相关访问信息1的访问内容,存储模块16即将访问内容通过检索模块15反馈给中央处理器13,中央处理器13通过诊断模块26诊断访问内容是否与访问信息的访问内容一致,一致后通过传输模块27将访问内容传输到显示模块14,若数据库3内没有存储相关访问信息1的访问内容,存储模块16通过检索模块15向搜索引擎18的输入模块二19发出命令,输入模块二19向信息采集单元20发送命令搜集云端4的相关访问信息1的访问内容,云端4将访问内容反馈给信息采集单元20并通过信息分类单元21分类,即可将该访问内容储存在搜索引擎18的信息存储单元22内,便于下次搜索时直接访问,信息存储单元22通过输出模块23向检索模块15执行命令,检索模块15将访问内容传送给中央处理器13,中央处理器13通过显示模块14向用户显示访问信息1的相关访问内容,当前一次输入模块一6内的访问信息1未通过信息清理模块5清除,则本次的访问信息1若在上次访问信息1的集合范围内,则本次的访问信息1的访问范围基于上次的访问信息1范围之内,使本次的访问信息1的访问范围缩小,达到了自动缩小访问信息1的访问范围效果,无需缩小访问范围时即可通过信息清理模块5清除上次访问信息1内容即可,访问信息1的访问内容通过中央处理器13和通信模块17从数据库3内获取,若数据库3内没有检索到相关信息即可从云端4内获取,且数据库3具有自动学习能力,将从云端4获取的访问信息1的访问内容分类自动通过存储模块16存储,便于下次检索,为下次检索相同访问信息1节约了时间,达到了缩小用户筛选有用信息范围,自动保存用户常用访问信息1记录的目的。
[0044] 综上可得,本发明通过设置数据分析服务器2、数据库3、信息清理模块5、杀毒系统12和中央处理器13,解决了现有大数据技术针对大数据的关键信息内容在匹配识别时,通过关键词识别的匹配信息范围较广且内容较多,增大了用户筛选出有用信息难度的问题。
[0045] 需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。
[0046] 尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、
修改、替换和变型,本发明的范围由所附
权利要求及其等同物限定。