首页 / 专利库 / 地球科学 / / 一种面向电网电磁环境的网络舆情及风险信息监测系统、电子设备

一种面向电网电磁环境的网络舆情及险信息监测系统、电子设备

阅读:102发布:2021-06-15

专利汇可以提供一种面向电网电磁环境的网络舆情及险信息监测系统、电子设备专利检索,专利查询,专利分析的服务。并且本 发明 公开了一种面向 电网 电磁环境的网络舆情及 风 险信息监测系统,包括:风险信息分布式爬取模 块 ,用于使用针对电网电 磁场 风险信息主题的分布式 网络爬虫 从网络中获取相关数据,为其他模块提供数据;风险发现与 情感分析 模块,用于发现电网 电磁场 风险信息话题并分析识别情感倾向性,对电网电磁场舆情及风险信息进行分析处理;自动文摘模块,自动形成舆情及风险信息结论;公众信息平台模块,对舆情及风险信息进行展示;使用 云 计算技术对所述信息进行统计分析,获取舆情事件的影响程度,能够了解在国家电网工程建设和运行过程中公众对电网电磁环境的看法和态度、 跟踪 电磁 环境网络 舆情信息及风险,解决面向电网电磁环境的舆情监测系统的需求问题。,下面是一种面向电网电磁环境的网络舆情及险信息监测系统、电子设备专利的具体信息内容。

1.一种面向电网电磁环境的网络舆情及险信息监测系统,其特征在于,包括:
风险信息分布式爬取模,用于使用针对电网电磁场风险信息主题的分布式网络爬虫从网络中获取相关数据,为其他模块提供数据;
风险发现与情感分析模块,用于发现电网电磁场风险信息话题并分析识别情感倾向性,对电网电磁场舆情及风险信息进行分析处理;
自动文摘模块,依据风险发现与情感分析模块对电网电磁场舆情及风险信息分析处理的结果,自动形成舆情及风险信息结论;
公众信息平台模块,对风险信息分布式爬取模块、风险发现与情感分析模块、自动文摘模块的数据进行展示;使用计算技术对所述数据进行统计分析,获取舆情事件的影响程度。
2.根据权利要求1所述的系统,其特征在于,风险信息分布式爬取模块,包括:URL搜索与爬取单元、垃圾信息过滤单元、文档存储与检索单元、中文分词单元,其中:
URL搜索与爬取单元,通过URL搜索和爬虫,根据中文分词单元提供的关键词从网络中获取电网电磁场风险信息;
垃圾信息过滤单元,用于识别和去除URL搜索与爬取单元获得的电网电磁场风险信息中的垃圾信息。
文档存储与检索单元,提供对信息抽取单元数据的存储与检索;
中文分词单元,加入了电网领域相关的词汇表,为URL搜索与爬取单元提供关键词;
信息抽取单元,对URL搜索与爬取单元获取的电网电磁场风险信息,通过基于关键词检索的信息抽取和基于语义的实体关系抽取,保存于文档存储与检索单元。
3.根据权利要求1所述的系统,其特征在于,风险信息分布式爬取模块,采用分布式并行处理方式。
4.根据权利要求1所述的系统,其特征在于,风险发现与情感分析模块,包括:话题聚类发现单元、情感分析单元、风险因素分类单元,其中:
话题聚类发现单元,用于计算所有新闻的相似性并进行聚类,发现重要的电网电磁场风险信息话题;
情感分析单元,用于对电网电磁场风险信息话题的情感值进行评价分析识别情感倾向性;
风险因素分类单元,用于根据风险词判断风险因素,结合电网行业特征,对电网电磁场风险信息话题涉及的危险因素进行分类。
5.根据权利要求4所述的系统,其特征在于,话题聚类发现单元,用于计算所有新闻的相似性并进行聚类,发现重要的话题,包括:
使用向量空间模型表示句子特征,并使用向量余弦值计算句子间相似度,使用K-means算法进行聚类,发现重要的电网电磁场风险信息话题。
6.根据权利要求1所述的系统,其特征在于,自动文摘模块,包括:特征选择单元、重要性排序单元、内容重组单元,其中:
特征选择单元,用于从句子中提取特征并用于计算句子间相似度;
重要性排序单元,使用PageRank算法对文档句子按照重要性进行排序;
内容重组单元,从重要句子中抽取信息,重新组合成完整句子。
7.根据权利要求1所述的系统,其特征在于,公众信息平台模块,包括:数据统计单元、数据分析单元、云计算与混合架构单元、智能处理单元,其中:
数据统计单元,用于对风险信息分布式爬取模块、风险发现与情感分析模块、自动文摘模块的数据统计展示;
数据分析单元,对风险信息分布式爬取模块、风险发现与情感分析模块、自动文摘模块的数据统计、聚类、提取特征结果的展示;
云计算与混合架构单元,使用云计算技术对数据统计和分析;公众信息平台模块采用客户/服务器和浏览器/服务器混合架构;
智能处理单元,根据分布式爬取模块、风险发现与情感分析模块、自动文摘模块的数据,对舆情事件影响程度进行分析,并自动发出预警。
8.一种电子设备,其特征在于,包括:
处理器;以及
存储器,用于存储一种面向电网电磁环境的网络舆情及风险信息的监测系统,该设备通电并通过所述处理器运行所述用于系统后,执行下述步骤:
使用针对电网电磁场风险信息主题的分布式网络爬虫从网络中获取相关数据,为其他模块提供数据;
发现电网电磁场风险信息话题并分析识别情感倾向性,对电网电磁场舆情及风险信息进行分析处理;
自动形成舆情及风险信息结论;
对舆情及风险信息进行展示;使用云计算技术对所述信息进行统计分析,获取舆情事件的影响程度。

说明书全文

一种面向电网电磁环境的网络舆情及险信息监测系统、电

子设备

技术领域

[0001] 本申请涉及互联网文本信息的舆情监测分析领域,具体涉及一种面向电网电磁环境的网络及风险信息舆情监测系统。

背景技术

[0002] 电网电磁环境网络舆情是国网公司在社会及自身发展过程中急需关注的问题。公司承担着重要的社会责任,需要了解在输变电工程建设和运行过程中公众对电网电磁环境的看法和态度,有必要跟踪电磁环境网络舆情信息及风险状况,第一时间发现、获取、掌握电磁场风险信息,对舆情倾向性进行情感分析,客观科学决策。
[0003] 目前存在一些类似的舆情监控系统,例如,微博舆情监控(专利公开号CN104537097A),该专利使用多种微博舆情监测算法获取微博舆情热点,对获取的微博舆情热点进行综合判断分类评估;再如,微信舆情监测系统(专利公开号CN104504151A),使用多种微信舆情监测算法模来获取微信舆情热点,并对获取的微信舆情热点进行综合判断分类评估。
[0004] 尽管上述技术方案存在一定效果,但仍有不足:目前的舆情系统是无差别的新闻系统,无法针对电网特定领域。发明内容
[0005] 本申请提供一种面向电网电磁环境的网络舆情及风险信息监测系统,解决面向电网电磁环境的舆情监测系统的需求问题。
[0006] 本申请提供一种面向电网电磁环境的网络舆情及风险信息监测系统,包括:
[0007] 风险信息分布式爬取模块,用于使用针对电网电磁场风险信息主题的分布式网络爬虫从网络中获取相关数据,为其他模块提供数据;
[0008] 风险发现与情感分析模块,用于发现电网电磁场风险信息话题并分析识别情感倾向性,对电网电磁场舆情及风险信息进行分析处理;
[0009] 自动文摘模块,依据风险发现与情感分析模块对电网电磁场舆情及风险信息分析处理的结果,自动形成舆情及风险信息结论;
[0010] 公众信息平台模块,对风险信息分布式爬取模块、风险发现与情感分析模块、自动文摘模块的数据进行展示;使用计算技术对所述数据进行统计分析,获取舆情事件的影响程度。
[0011] 优选的,风险信息分布式爬取模块,包括:URL搜索与爬取单元、垃圾信息过滤单元、文档存储与检索单元、中文分词单元,其中:
[0012] URL搜索与爬取单元,通过URL搜索和爬虫,根据中文分词单元提供的关键词从网络中获取电网电磁场风险信息;
[0013] 垃圾信息过滤单元,用于识别和去除URL搜索与爬取单元获得的电网电磁场风险信息中的垃圾信息。
[0014] 文档存储与检索单元,提供对信息抽取单元数据的存储与检索;
[0015] 中文分词单元,加入了电网领域相关的词汇表,为URL搜索与爬取单元提供关键词;
[0016] 信息抽取单元,对URL搜索与爬取单元获取的电网电磁场风险信息,通过基于关键词检索的信息抽取和基于语义的实体关系抽取,保存于文档存储与检索单元。
[0017] 优选的,风险信息分布式爬取模块,采用分布式并行处理方式。
[0018] 优选的,风险发现与情感分析模块,包括:话题聚类发现单元、情感分析单元、风险因素分类单元,其中:
[0019] 话题聚类发现单元,用于计算所有新闻的相似性并进行聚类,发现重要的电网电磁场风险信息话题;
[0020] 情感分析单元,用于对电网电磁场风险信息话题的情感值进行评价分析识别情感倾向性;
[0021] 风险因素分类单元,用于根据风险词判断风险因素,结合电网行业特征,对电网电磁场风险信息话题涉及的危险因素进行分类。
[0022] 优选的,话题聚类发现单元,用于计算所有新闻的相似性并进行聚类,发现重要的话题,包括:
[0023] 使用向量空间模型表示句子特征,并使用向量余弦值计算句子间相似度,使用K-means算法进行聚类,发现重要的电网电磁场风险信息话题。
[0024] 优选的,自动文摘模块,包括:特征选择单元、重要性排序单元、内容重组单元,其中:
[0025] 特征选择单元,用于从句子中提取特征并用于计算句子间相似度;
[0026] 重要性排序单元,使用PageRank算法对文档句子按照重要性进行排序;
[0027] 内容重组单元,从重要句子中抽取信息,重新组合成完整句子。
[0028] 优选的,包括:数据统计单元、数据分析单元、云计算与混合架构单元、智能处理单元,其中:
[0029] 数据统计单元,用于对风险信息分布式爬取模块、风险发现与情感分析模块、自动文摘模块的数据统计展示;
[0030] 数据分析单元,对风险信息分布式爬取模块、风险发现与情感分析模块、自动文摘模块的数据统计、聚类、提取特征结果的展示;
[0031] 云计算与混合架构单元,使用云计算技术对数据统计和分析;公众信息平台模块采用客户/服务器和浏览器/服务器混合架构;
[0032] 智能处理单元,根据分布式爬取模块、风险发现与情感分析模块、自动文摘模块的数据,对舆情事件影响程度进行分析,并自动发出预警。
[0033] 本申请同时提供一种电子设备,包括:
[0034] 处理器;以及
[0035] 存储器,用于存储一种面向电网电磁环境的网络舆情及风险信息的监测系统,该设备通电并通过所述处理器运行所述用于系统后,执行下述步骤:
[0036] 使用针对电网电磁场风险信息主题的分布式网络爬虫从网络中获取相关数据,为其他模块提供数据;
[0037] 发现电网电磁场风险信息话题并分析识别情感倾向性,对电网电磁场舆情及风险信息进行分析处理;
[0038] 自动形成舆情及风险信息结论;
[0039] 对舆情及风险信息进行展示;使用云计算技术对所述数信息进行统计分析,获取舆情事件的影响程度。
[0040] 本申请提供一种面向电网电磁环境的网络舆情及风险信息监测系统,通过风险信息分布式爬取模块、自动文摘模块、公众信息平台模块,能够了解在国家电网工程建设和运行过程中公众对电网电磁环境的看法和态度、跟踪电磁环境网络舆情信息及风险,解决面向电网电磁环境的舆情监测系统的需求问题。附图说明
[0041] 图1是本申请实施例提供的一种面向电网电磁环境的网络舆情及风险信息监测系统的结构示意图。

具体实施方式

[0042] 在下面的描述中阐述了很多具体细节以便于充分理解本申请。但是本申请能够以很多不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本申请内涵的情况下做类似推广,因此本申请不受下面公开的具体实施的限制。
[0043] 图1为本申请实施例提供的一种面向电网电磁环境的网络舆情及风险信息监测系统的结构示意图,下面结合图1对本申请实施例提供的系统进行详细说明。
[0044] 一种面向电网电磁环境的网络舆情及风险信息监测系统,包括:
[0045] 风险信息分布式爬取模块,用于使用针对电网电磁场风险信息主题的分布式网络爬虫从网络中获取相关数据,为其他模块提供数据;
[0046] 风险发现与情感分析模块,用于发现电网电磁场风险信息话题并分析识别情感倾向性,对电网电磁场舆情及风险信息进行分析处理;
[0047] 自动文摘模块,依据风险发现与情感分析模块对电网电磁场舆情及风险信息分析处理的结果,自动形成舆情及风险信息结论;
[0048] 公众信息平台模块,对风险信息分布式爬取模块、风险发现与情感分析模块、自动文摘模块的数据进行展示;使用云计算技术对所述数据进行统计分析,获取舆情事件的影响程度。
[0049] 风险信息分布式爬取模块,是整个系统的数据基础,包括:URL搜索与爬取单元、垃圾信息过滤单元、文档存储与检索单元、中文分词单元,其中:
[0050] URL搜索与爬取单元,通过URL搜索和爬虫,根据中文分词单元提供的关键词从网络中获取电网电磁场风险信息;URL搜索与爬取单元采用了多种数据源,包括网省电公司、政府处罚信息、企业信用信息、网络新闻等。
[0051] 垃圾信息过滤单元,用于识别和去除URL搜索与爬取单元获得的电网电磁场风险信息中的垃圾信息。
[0052] 文档存储与检索单元,提供对信息抽取单元数据的存储与检索;
[0053] 中文分词单元,加入了电网领域相关的词汇表,为URL搜索与爬取单元提供关键词;中文分词单元加入了电网领域的特定词汇,例如电磁辐射、电磁污染、电离辐射等。
[0054] 信息抽取单元,对URL搜索与爬取单元获取的电网电磁场风险信息,通过基于关键词检索的信息抽取和基于语义的实体关系抽取,保存于文档存储与检索单元。
[0055] 风险信息分布式爬取模块采用分布式并行处理方式。
[0056] 风险发现与情感分析模块,包括:话题聚类发现单元、情感分析单元、风险因素分类单元,其中:
[0057] 话题聚类发现单元,用于计算所有新闻的相似性并进行聚类,发现重要的话题,使用向量空间模型表示句子特征,并使用向量余弦值计算句子间相似度,使用K-means算法进行聚类,发现重要的电网电磁场风险信息话题。;
[0058] 情感分析单元,用于对电网电磁场风险信息话题的情感值进行评价分析识别情感倾向性;
[0059] 风险因素分类单元,用于根据风险词判断风险因素,结合电网行业特征,对电网电磁场风险信息话题涉及的危险因素进行分类。风险因素分类单元维护一个风险因素表,例如下表,根据文中出现的风险词判断风险因素。
[0060]
[0061] 自动文摘模块,包括:特征选择单元、重要性排序单元、内容重组单元,其中:
[0062] 特征选择单元,用于从句子中提取特征并用于计算句子间相似度,使用句子的TF-IDF作为特征值,并由PageRank算法计算文档中各个句子的重要程度,根据重要句子在文中的位置、属性、关系进行句子重组;
[0063] 重要性排序单元,使用PageRank算法对文档句子按照重要性进行排序;
[0064] 内容重组单元,从重要句子中抽取信息,重新组合成完整句子。
[0065] 公众信息平台模块,使用云计算技术与C/S和B/S混合架构。包括:数据统计单元、数据分析单元、云计算与混合架构单元、智能处理单元,其中:
[0066] 数据统计单元,用于对风险信息分布式爬取模块、风险发现与情感分析模块、自动文摘模块的数据统计展示;
[0067] 数据分析单元,对风险信息分布式爬取模块、风险发现与情感分析模块、自动文摘模块的数据统计、聚类、提取特征结果的展示;
[0068] 云计算与混合架构单元,使用云计算技术对数据统计和分析;公众信息平台模块采用客户/服务器和浏览器/服务器混合架构;
[0069] 智能处理单元,根据分布式爬取模块、风险发现与情感分析模块、自动文摘模块的数据,对舆情事件影响程度进行分析,并自动发出不同级别的预警。
[0070] 与本申请提供的一种面向电网电磁环境的网络舆情监测系统,相对应的,本申请同时提供本申请同时提供一种电子设备,包括:
[0071] 处理器;以及
[0072] 存储器,用于存储一种面向电网电磁环境的网络舆情及风险信息的监测系统,该设备通电并通过所述处理器运行所述用于系统后,执行下述步骤:
[0073] 使用针对电网电磁场风险信息主题的分布式网络爬虫从网络中获取相关数据,为其他模块提供数据;
[0074] 发现电网电磁场风险信息话题并分析识别情感倾向性,对电网电磁场舆情及风险信息进行分析处理;
[0075] 自动形成舆情及风险信息结论;
[0076] 对舆情及风险信息进行展示;使用云计算技术对所述数信息进行统计分析,获取舆情事件的影响程度。
[0077] 本申请提供一种面向电网电磁环境的网络舆情及风险信息监测系统,通过风险信息分布式爬取模块、自动文摘模块、公众信息平台模块,能够了解在国家电网工程建设和运行过程中公众对电网电磁环境的看法和态度、跟踪电磁环境网络舆情信息及风险,解决面向电网电磁环境的舆情监测系统的需求问题。同时能够捕捉到电网相关的网络舆情信息,在海量数据中获取舆论变化情况,有助于改善电力企业的外部环境压力现状,营造良好的电网发展外部环境。
[0078] 本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
[0079] 本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
[0080] 这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
[0081] 这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
[0082] 最后应该说明的是:以上实施例仅用以说明本发明的技术方案而非对其限制,尽管参照上述实施例对本发明进行了详细的说明,所属领域的普通技术人员应当理解依然可以对本发明的具体实施方式进行修改或者等同替换,而未脱离本发明精神和范围的任何修改或者等同替,其均应涵盖在本发明的权利要求范围当中。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈