专利汇可以提供一种情感词语文本信息分类方法专利检索,专利查询,专利分析的服务。并且本 发明 公开了一种情感词语文本信息分类方法,包括:获取文本信息;输入文本词语;判断词性,所述判断文本中词性分为情感词、否定词、程度副词;情感词打分,情感词输入情感词词典打分,得到分值1;判断情感词前后,判断情感词前后是否对应程度副词;得到新的情感词分值2;再次判断情感词前后,得到情感词分值3;输出文本最终得分,各情感词最终得分之和;根据文本最终得分划分文本类别。本发明旨在建立一个文本信息分类模型,目的是对文本进行情感色彩打分,进而将文本划分为正向、中立、负向三个类别。,下面是一种情感词语文本信息分类方法专利的具体信息内容。
1.一种情感词语文本信息分类方法,其特征在于,包括:
获取文本信息;
输入文本词语;
判断词性,所述判断文本中词性分为情感词、否定词、程度副词;
情感词打分,情感词输入情感词词典打分,得到分值1;
判断情感词前后,判断情感词前后是否对应程度副词;
得到新的情感词分值2;
再次判断情感词前后,得到情感词分值3;
输出文本最终得分,各情感词最终得分之和;
根据文本最终得分划分文本类别。
2.根据权利要求1所述的情感词语文本信息分类方法,其特征在于:还包括文本词典,所述文本词典包含建立情感词典、否定词词典和程度副词词典,将每个文本对象的单词列表中的词归类,生成此个文本对象的情感词词典、否定词词典和程度副词词典。
3.根据权利要求2所述的情感词语文本信息分类方法,其特征在于:所述情感词典包括正向情感词和负向情感词,程度副词词典和情感词有分值,否定词没有分值。
4.根据权利要求3所述的情感词语文本信息分类方法,其特征在于:还包含了建立文本数据集,人工对每一个文本对象做标记,划分该文本的情感分类,分为正向、中立、负向3类,分别标记为1、0、-1,每个文本对象利用结巴分词进行处理并根据停用词词典去除停用词,得到每个文本的单词列表。
5.根据权利要求1-4任意一项所述的情感词语文本信息分类方法,其特征在于:判断情感词前后分数计算范围为两个情感词之间的否定词和程度副词与其中后一个情感词构成一个情感词组,所有情感词组的得分之和即为文本的情感极性得分。公式如下:
其中ai为第i个情感词组中的否定词词数,bi为此词组中所有程度副词的权值之积,ci为情感副词的得分。
标题 | 发布/更新时间 | 阅读量 |
---|---|---|
一种基于VR技术的记忆提升检测方法及系统 | 2020-05-08 | 482 |
说话人确认方法和装置 | 2020-05-08 | 767 |
数字串声纹密码验证方法及系统 | 2020-05-08 | 501 |
基于匿名化及差分隐私技术的用电数据脱敏方法及系统 | 2020-05-11 | 686 |
基于语音的评分方法及相关装置 | 2020-05-08 | 295 |
一种基于信用大数据的标签分类和定量分析方法 | 2020-05-08 | 949 |
一种基于文本主题的网页暗链检测方法和装置 | 2020-05-11 | 381 |
一种游戏平台用户问答业务的短文本分类方法 | 2020-05-08 | 555 |
文本检测方法、装置、电子设备及存储介质 | 2020-05-11 | 519 |
文档层级划分方法、文档层级划分装置和可读存储介质 | 2020-05-11 | 485 |
高效检索全球专利专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。
我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。
专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。