专利汇可以提供一种基于主题下的情感分析方法专利检索,专利查询,专利分析的服务。并且本 发明 公开了一种基于主题下的 情感分析 方法,属于 人工智能 领域,生成相应主题下语义拓展数据;语义拓展数据和同义词表进行以词分解得到分词库,标注分词库中每个词语的意思表示;根据意思表示组合生成语义二类分词,收集到二类分词库,把二类分词库与语义拓展数据融合得到语义增广数据。通过根据不同的主题收取不同的语料,然后根据相应主题领域的语料进行增广 数据处理 ,得到更加丰富的语料,在后期的情感判断中更加精准,对每个的语料判断时考虑到前后的语料情感因数,更好的结合与人的感情情景模式相适应,更好的符合情感分析的情景结合,分析的情感更加的准确,解决现有情感分析方法不能够跨领域使用,同时判断的情感值不精准的技术问题。,下面是一种基于主题下的情感分析方法专利的具体信息内容。
1.一种基于主题下的情感分析方法,其特征在于,所述方法包括如下步骤:
步骤1:确定分析的主题,根据现有的互联网主题语料生成基于相应主题下的同义词表;
步骤2:生成相应主题下语义拓展数据;
步骤3:语义拓展数据和同义词表进行以词分解得到分词库,标注分词库中每个词语的意思表示;
步骤4:根据意思表示组合生成语义二类分词,收集得到二类分词库,把二类分词库与语义拓展数据融合得到语义增广数据;
步骤5:把语义增广数据输入神经网络模型进行训练得到词向量模型;
步骤6:给语义增广数据中的词赋予情感数值,并对每个词以字为单位分解,并被赋予每个字的多向感情数值,并汇集词的情感数值与字的单字的情感值得到情感判别库;
步骤7:把需要分析的语句文本输入到词向量模型得到词向量;
步骤8:把词向量输入到情感判别库得到以词向量为基础的第一情感值;
步骤9:把词向量进行以词分解得到单字集合,并输入情感判别库得到以字为基础的第二情感值;
步骤10:把第一情感值和第二情感值计算输入文本的情感值。
2.根据权利要求1所述的一种基于主题下的情感分析方法,其特征在于:所述步骤1中的具体过程为:
人工输入确定需要分析的文本多对应的主题领域,通过互联网获取公开的该主题领域下的基本文本语料集D;
使用分词工具对语料集D进行分词,全用尺寸为5,步长为2窗口获得二元语言学训练数据;
将二元语言学训练数据进行Word2Vec模型训练得到词向量表示;
计算每两个词向量vi,vj间的夹角余值作为两个词的相似度,获得相似度量矩阵;具体的计算公式是:
通过度量获取与词vi最邻近的3个词即vi的3个同义词得到警情领域的同义词表。
3.根据权利要求1所述的一种基于主题下的情感分析方法,其特征在于:所述步骤2的具体过程为:
随机选择一条语料输入,判断该类语料数量n是否大于等于1000条;
如果n小于1000,直接采样输出该语料,如果n大于等于1000执行下一步;
对输入的语料进行分词,获得该语料词的分词表;
等概率生成[A,B,C,D,E]中的一个随机变量N,如N=A采用同义词替换法该语料情的分词表中的3个单词生成新语料;如N=B在句子中找到一个随机词的随机同义词,将该同义词插入句子中的随机位置生成新语料;如N=C随机选择分词表里的两个单词交换位置生成新语料;如N=D随机删除分词表中的E个单词生成新语料;如N=4直接输出该语料。
4.根据权利要求1所述的一种基于主题下的情感分析方法,其特征在于:所述步骤3的具体过程为:
语义拓展数据和同义词表根据中文词典进行语义分词,并汇总所有分词,同时从中文词典中找出语义分词的具体的意思,并标注在每个语义分词的后面,形成一一映射关系。
5.根据权利要求1所述的一种基于主题下的情感分析方法,其特征在于:所述步骤4的具体过程为:
从原来语义分词的意思中搜索与该意思相近或者相同的词汇,然后汇总得等到二类分词库,二类分词库与语义拓展数据融合时,意思相同或者相近的词汇总一起,并根据情感程度进行排序,得到语义增广数据。
6.根据权利要求1所述的一种基于主题下的情感分析方法,其特征在于:所述步骤6中的具体过程为:
使用情感词典文本匹配算法对语义增广数据中的词赋予情感数值,然后把每个词汇进行分解,把所有词中具有相同的字进行汇总为一个字,则相同的字具有多向的情感值,多向的情感值与该字所在的词的情感值相同,然后对该字求均值得到单字的情感值。
7.根据权利要求1所述的一种基于主题下的情感分析方法,其特征在于:所述步骤8的具体过程为:
判断词的词性,如果为词的词性为积极词语时,检测前后词语,判断前一词语为程度副词时,词的感情数值乘以程度副词的权重,前一词为否定词或者消极词时,词的感情数值减一,后一词为消极词时,词的感情数值减一,前后词为其他词性时,词的感情数值加上前词的权重;
如果词性为消极词时,检测前一词,前一词为程度副词时,词的感情数值乘以程度副词的权重,前一次为否定词时,词的感情数值减加一,前一词为其他词性时,词的感情数值减去前词的权重,然后输出该词的第一情感值。
8.根据权利要求1所述的一种基于主题下的情感分析方法,其特征在于:所述步骤9的具体过程为:把词中的每个字的单字的情感值乘以字词权重得到每个字所在词的感情值,把每个字所在词的感情值相加得到第二情感值,其中字词权重的配比为,动作字与名次结合时的配比为7:3,程度字与动作字结合时的配比为2:8。
9.根据权利要求1所述的一种基于主题下的情感分析方法,其特征在于:所述步骤10计算的具体过程为:使用以下算式计算,
K=A*tanh((Q-B)*(Va-Vc))-A·tanh((H-B)*(Va-Vd))
其中,K表示第一情感值的权重,A=0.8,B=15,Q=A*23,H=A*40,Va=1.3,Vc=0.95,Vd=1.05;
Vfinal=(1-K)*Vd+K*Va;
Vfinal为情感值。
标题 | 发布/更新时间 | 阅读量 |
---|---|---|
一种文本摘要和情感分类联合训练方法 | 2020-05-14 | 556 |
一种图像识别的英语作文跑题判断方法 | 2020-05-08 | 70 |
一种用于智能质检服务禁语的识别方法及系统 | 2020-05-08 | 805 |
一种基于Bi-LSTM网络的无监督属性的抽取方法 | 2020-05-11 | 47 |
非命名实体对象抽取方法、装置、电子设备及存储介质 | 2020-05-13 | 627 |
基于XML的领域要素提取配置语言系统 | 2020-05-08 | 55 |
一种公司形象提升系统的社交网络数据提取方法及系统 | 2020-05-11 | 985 |
一种面向金融事件的混合型因果关系发现方法 | 2020-05-11 | 513 |
业务问题提取方法及装置 | 2020-05-14 | 730 |
一种基于主题模型和语义分析的实体指称项识别方法 | 2020-05-11 | 651 |
高效检索全球专利专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。
我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。
专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。