专利汇可以提供网络言论数据疑似犯罪度计算方法专利检索,专利查询,专利分析的服务。并且网络言论数据疑似犯罪度计算方法属智能安防技术领域,本 发明 提出了网络言论疑似犯罪度这一概念,定义它为社交网络上某ID通过其言论表现出来的犯罪可能性,以犯罪 心理学 为理论依据,总结出犯罪心理表现出的言论特征,提出了网络言论犯罪度的需求因素、情绪因素和准备因素影响模型;以 文本分析 技术手段、运用朴素贝叶斯分类器对需求因素进行判断,利用情感词典对情绪因素进行判断,构建了犯罪敏感词词典并结合 机器学习 的方法对准备因素进行判断,建立了网络言论疑似犯罪度理论 框架 和数学模型;本发明能将预警提前到犯罪心理形成和犯罪准备阶段,运用到实际网络中可全程自动分析预测大量数据,不需人为干预,可将安防系统智能化提升到更高层次。,下面是网络言论数据疑似犯罪度计算方法专利的具体信息内容。
1.一种网络言论数据疑似犯罪度计算方法,其特征在于包括下列步骤:
1.1定义网络言论疑似犯罪度:社交网络上某ID通过其言论表现出来的犯罪可能性大小;
1.2网络言论疑似犯罪度的影响因素判断,具体包括下列步骤:
1.2.1需求因素判断:通过朴素贝叶斯分类器对网络言论是否有需求得不到满足语义倾向进行判断,具体包括下列步骤:
1.2.1.1在社交网络上收集初始言论样本,将其中的言论分为有需求得不到满足之意的言论,标注为1;没有需求得不到满足之意的言论,标注为0;
1.2.1.2预处理:将步骤1.2.1.1中收集的初始言论样本去除标点和停顿词,分词;
1.2.1.3将预处理后的言论样本中标注为1和标注为0的言论中70%的言论归类为待用训练言论样本;剩下的30%的言论归类为待用测试言论样本;
1.2.1.4将步骤1.2.1.3中的待用训练言论样本放到朴素贝叶斯分类器中训练得到预测函数为:
其中:vNB表示朴素贝叶斯分类器输出的目标值;集合V是标注集合{1,0};P(vj)代表不同标注的数据量占总数据量的比例;ai表示测试样本中不同位置的词语;
用预测函数预测待用测试言论样本的类型,与标注类型比较,得出分类器预测待用测试言论样本的正确率;
1.2.2情绪因素判断:采用基于台湾大学情感词库NTUSD的方法,判断网络言论表现出的情绪是否消极,消极情绪是否累积与叠加,具体包括下列步骤:
1.2.2.1预处理:对每条网络言论按标点分句、分词、去除停顿词;
1.2.2.2情感极性判断:
(1)定义每条言论的总情感值为emotionValue,简称eV;
(2)定义一条言论中一句话的情感值为sonEmotionValue,简称sV;
(3)词语匹配
a.匹配情感词:有一个消极词汇sV减1,有一个积极词汇sV加1,中性词sV值不变;
b.匹配否定词:有奇数个否定词sV正负号取反,有偶数个否定词sV符号不变;
c.匹配程度词:有一个程度词,sV符号不变,绝对值加1;
(4)计算eV,每条言论的总情感值eV等于言论中m句话的sV求和;定义n为消极言论的数量,如果eV<0,n加1;
(5)重复步骤1.2.2.2的(1)、(2)、(3)、(4),判断所有N条言论的情感极性;
1.2.2.3计算消极强度IoN
其中:IoN表示消极强度,衡量消极言论的积累程度,并为总的网络言论犯罪度做得分修正;N为监测最近言论的数量;
1.2.3准备因素判断:综合运用机器学习和情感词典的方法,分析言论中是否有为犯罪做准备的语义倾向,具体包括下列步骤:
1.2.3.1构建犯罪敏感词词典:
通过网络敏感词词典,筛选出犯罪敏感词,再通过犯罪类书籍和相关资料扩充犯罪敏感词词典;
1.2.3.2根据步骤1.2.3.1构建的犯罪敏感词词典,对检测出的网络言论中含有犯罪敏感词的言论进行真阳性检验,检测出含有犯罪敏感词的言论中确实有为犯罪做准备语义倾向的言论;真阳性检验采用机器学习的方法,采集训练数据,将含有犯罪敏感词的言论分为真阳性和假阳性两组,分别标注为1和0,用步骤1.2.1中的朴素贝叶斯分类器,生成预测函数,实现真阳性检验;
1.3建立网络言论疑似犯罪度计算模型,具体包括下列步骤:
1.3.1构建网络言论犯罪度向量,用 表示:
其中:c1,c2...cN为每条言论的类型数值或者类型坐标;有消极语义,数值为1;有需求得不到满足语义,数值为2;有为犯罪做准备语义,数值为3;无以上类型语义,数值为0;犯罪度向量用队列存储;通过步骤1.2中需求因素、情绪因素和准备因素的判断方法,识别网络上某ID主页中最近N条言论类型,生成犯罪度向量,当言论更新时将最新言论的类型插入队尾,并删除队头;
1.3.2网络言论疑似犯罪度(Crime Degree of Speech):通过步骤
其中: 为向量 的1范数,考虑到不是以需求为诱因,以心情为主导,而是行为人的自我实现需要本身就是反社会的,并会采取攻击行为来满足自身需求的情况,要对消极强度IoN做修正,将其中n改为犯罪度向量 中坐标非0值的个数;
1.3.3通过网络爬虫程序自动抓取网络数据,通过步骤1.3.2中数学表达式(3),计算出社交网络上各ID的网络言论疑似犯罪度,对CoS规定不同的阈值,划分不同的警戒线,分类显示。
2.按权利要求1所述的网络言论数据疑似犯罪度计算方法,其特征在于步骤1.2.1.2所述的停顿词指汉语中表示停顿、无实际意义的词。
3.按权利要求1所述的网络言论数据疑似犯罪度计算方法,其特征在于步骤1.2.1.2所述的分词是将一个句子分为若干单词的意思。
4.按权利要求1所述的网络言论数据疑似犯罪度计算方法,其特征在于步骤1.2.1.3所述的待用训练言论样本指用于分类器训练形成预测函数的言论数据。
5.按权利要求1所述的网络言论数据疑似犯罪度计算方法,其特征在于步骤1.2.1.3所述的待用测试言论样本指用于分类器测试,衡量分类器分类性能的言论数据。
6.按权利要求1所述的网络言论数据疑似犯罪度计算方法,其特征在于步骤1.2.2.2所述的正负号取反指若sV原来为正,则取负;sV原来为负,则取正。
7.按权利要求1所述的网络言论数据疑似犯罪度计算方法,其特征在于步骤1.2.2.2所述的程度词指表示程度的修饰词。
8.按权利要求1所述的网络言论数据疑似犯罪度计算方法,其特征在于步骤1.2.3.1所述的犯罪敏感词指有为犯罪做准备语义的词语。
标题 | 发布/更新时间 | 阅读量 |
---|---|---|
一种用于心理学实验的装置 | 2020-05-19 | 681 |
一种心理学用沙盘模具 | 2020-05-12 | 214 |
一种心理学方法 | 2020-05-11 | 86 |
一种心理学专业用讲台 | 2020-05-13 | 448 |
一种心理学职业能力测评系统 | 2020-05-16 | 803 |
心理学用康复训练吊脚娃娃模板 | 2020-05-17 | 532 |
一种心理学沙盘模具 | 2020-05-12 | 838 |
基于心理学的职业能力测评系统 | 2020-05-15 | 363 |
一种心理学催眠教具 | 2020-05-13 | 343 |
一种心理学实验头眼距离固定装置 | 2020-05-14 | 406 |
高效检索全球专利专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。
我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。
专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。