首页 / 专利库 / 牙科学 / 牙齿 / 智齿 / 基于用户会话行为的细粒度情绪分析方法

基于用户会话行为的细粒度情绪分析方法

阅读:968发布:2020-06-21

专利汇可以提供基于用户会话行为的细粒度情绪分析方法专利检索,专利查询,专利分析的服务。并且本 发明 公开了一种基于用户会话行为的细粒度情绪分析方法,包括以下步骤:S1、将用户的对话语句的每个字均以向量方式表示,生成所述用户的对话语句的向量语句形式;S2、情绪分类器通过所述向量语句形式判定语句的用户会话行为类别;S3、情绪分配器依据所述用户会话行为类别在预先设置的会话行为与情绪对应表中查询对应于所述用户会话行为类别的情绪分布,以生成最终的所述用户的对话语句的情绪细粒度分布。其实现了通过情绪原因推测用户对话语句的细粒度情绪分布,提高了情绪分析的准确度。,下面是基于用户会话行为的细粒度情绪分析方法专利的具体信息内容。

1.一种基于用户会话行为的细粒度情绪分析方法,其中,包括以下步骤:
S1、将用户的对话语句的每个字均以向量方式表示,生成所述用户的对话语句的向量语句形式;
S2、情绪分类器通过所述向量语句形式判定语句的用户会话行为类别;
S3、情绪分配器依据所述用户会话行为类别在预先设置的会话行为与情绪对应表中查询对应于所述用户会话行为类别的情绪分布,以生成最终的所述用户的对话语句的情绪细粒度分布。
2.如权利要求1所述的基于用户会话行为的细粒度情绪分析方法,其中,所述情绪分类器在预先构建的用户会话行为数据集上训练得到。
3.如权利要求1所述的基于用户会话行为的细粒度情绪分析方法,其中,所述用户会话行为数据集通过以下方法得到:
S1-1、收集多行业用户与客服的对话语句;
S1-2、按照预设的分类原则将收集的对话语句进行机器分类;
S1-3、将经机器分类的对话语句进行人工二次分类和校验;
S1-4、校验无误后即得到所述用户会话行为数据集。
4.如权利要求1所述的基于用户会话行为的细粒度情绪分析方法,其中,所述用户会话行为数据集共分为八个大类,八个所述大类包括:情绪正向类、情绪中向类、反映问题类、疑惑类、失望类、质疑类、愤怒类以及焦虑类。
5.如权利要求4所述的基于用户会话行为的细粒度情绪分析方法,其中,每个所述大类又依据类别不同分为多个小类。
6.如权利要求1所述的基于用户会话行为的细粒度情绪分析方法,其中,所述情绪细粒度分布包括多种情绪各自的浓度值。
7.如权利要求6所述的基于用户会话行为的细粒度情绪分析方法,其中,所述浓度值指愤怒、焦虑、疑惑、失望、感激以及愉快6个维度的细分情绪的浓度值。

说明书全文

基于用户会话行为的细粒度情绪分析方法

技术领域

[0001] 本发明涉及自然语言处理技术领域,尤其涉及一种基于用户会话行为的细粒度情绪分析方法。

背景技术

[0002] 在客服领域用户情绪是客服人员关注的很重要的方面。识别到用户的具体情绪有助于客服机器人对用户的回答更得体,而对于人工客服,对用户情绪的统计有助于分析用户对产品的满意度,以及对客服质量的评估。
[0003] 情绪分析分为篇章级、句子级和词汇级,其中句子级的情绪分析指分析用户语句的情绪分布。
[0004] 通常对于情绪的分类被视为一种多分类问题,目前大部分情绪分类分为情绪的正负中极性的区分和情绪的细粒度分析。情绪细粒度分析即将用户的情绪细分到具体的情绪,如大连理工情感词汇本体库DUTIR分为“乐、好、怒、哀、惧、恶、惊”7类基础情感,Ren_CECps分为“期待、高兴、喜爱、惊讶、焦虑、悲伤、生气、憎恨”8类情感。现有的细粒度情绪分析的具体做法有:
[0005] 1、基于情感词典:借助已有标注好的情绪词典如Ren_CECps里面标注了每个词每种情绪的浓度。通过计算句子中每个词的情绪浓度来计算句子的情绪浓度。
[0006] 2、基于分类模型:通过选取词频,词向量,n-gram等特征训练情绪分类器。常用的算法有朴素贝叶斯,SVM,决策树深度神经网络等。
[0007] 然而现有细粒度情绪分析有如下问题:
[0008] 1、已有的细粒度情绪分析针对微博,Twitter和商品评论数据较多,很少存在针对客服行业的细粒度情绪分析且客服领域细粒度情绪标记数据匮乏。
[0009] 2、不同领域、不同行业对情绪定义不同、关注点不同,已有的方法不能对不同领域做出区分。
[0010] 3、现有的细粒度情绪分析多为将一句话分类为某一种情绪,忽略了多种情绪并存的情况。
[0011] 4、现实情绪表达中有20%-30%是没有情感词的,这类属于隐式情感,而隐式情感多使用事实型陈述和语言修辞表达,这类问题通过情感词典方法很难区分出来。

发明内容

[0012] 本发明的一个目的是解决至少上述问题,并提供至少后面将说明的优点。
[0013] 本发明还有一个目的是提供一种基于用户会话行为的细粒度情绪分析方法,实现了通过情绪原因推测用户对话语句的细粒度情绪分布,提高了情绪分析的准确度。
[0014] 为实现上述目的和一些其他的目的,本发明采用如下技术方案:
[0015] 一种基于用户会话行为的细粒度情绪分析方法,包括以下步骤:
[0016] S1、将用户的对话语句的每个字均以向量方式表示,生成所述用户的对话语句的向量语句形式;
[0017] S2、情绪分类器通过所述向量语句形式判定语句的用户会话行为类别;
[0018] S3、情绪分配器依据所述用户会话行为类别在预先设置的会话行为与情绪对应表中查询对应于所述用户会话行为类别的情绪分布,以生成最终的所述用户的对话语句的情绪细粒度分布。
[0019] 优选的是,所述的基于用户会话行为的细粒度情绪分析方法中,所述情绪分类器在预先构建的用户会话行为数据集上训练得到。
[0020] 优选的是,所述的基于用户会话行为的细粒度情绪分析方法中,所述用户会话行为数据集通过以下方法得到:
[0021] S1-1、收集多行业用户与客服的对话语句;
[0022] S1-2、按照预设的分类原则将收集的对话语句进行机器分类;
[0023] S1-3、将经机器分类的对话语句进行人工二次分类和校验;
[0024] S1-4、校验无误后即得到所述用户会话行为数据集。
[0025] 优选的是,所述的基于用户会话行为的细粒度情绪分析方法中,在客服行业中,所述用户会话行为数据集共分为八个大类,八个所述大类包括:情绪正向类、情绪中向类、反映问题类、疑惑类、失望类、质疑类、愤怒类以及焦虑类。
[0026] 优选的是,所述的基于用户会话行为的细粒度情绪分析方法中,每个所述大类又依据类别不同分为多个小类。
[0027] 优选的是,所述的基于用户会话行为的细粒度情绪分析方法中,所述情绪细粒度分布包括多种情绪各自的浓度值。
[0028] 优选的是,所述的基于用户会话行为的细粒度情绪分析方法中,所述浓度值指愤怒、焦虑、疑惑、失望、感激以及愉快6个维度的细分情绪的浓度值。
[0029] 本发明至少包括以下有益效果:
[0030] 本发明的基于用户会话行为的细粒度情绪分析方法中,通过将用户的对话语句的每个字均以向量方式表示,然后利用情绪分类器判定所述向量语句形式的用户会话行为类别,最后情绪分配器依据所述用户会话行为类别在预先设置的会话行为与情绪对应表中查询对应于所述用户会话行为类别的情绪分布,以生成最终的所述用户的对话语句的情绪细粒度分布,实现了通过情绪原因推断用户细粒度情绪分布,因而可以更可靠地预测未来事件或评估潜在影响。
[0031] 通过用户会话行为各类别浓度值客户可自定义的方式实现对不同领域情绪浓度定制化,从而保证情绪分析的正确性,以及实现不同领域的定制化情绪分析。
[0032] 本发明的其它优点、目标和特征将部分通过下面的说明体现,部分还将通过对本发明的研究和实践而为本领域的技术人员所理解。附图说明
[0033] 图1是本发明提供的基于用户会话行为的细粒度情绪分析方法的流程图

具体实施方式

[0034] 下面结合附图对本发明做详细说明,以令本领域普通技术人员参阅本说明书后能够据以实施。
[0035] 如图1所示,一种基于用户会话行为的细粒度情绪分析方法,包括以下步骤:
[0036] S1、将用户的对话语句的每个字均以向量方式表示,生成所述用户的对话语句的向量语句形式;
[0037] S2、情绪分类器通过所述向量语句形式判定语句的用户会话行为类别;
[0038] S3、情绪分配器依据所述用户会话行为类别在预先设置的会话行为与情绪对应表中查询对应于所述用户会话行为类别的情绪分布,以生成最终的所述用户的对话语句的情绪细粒度分布。
[0039] 在上述方案中,一般来说,情绪计算有三个基本任务:1、情感分析:重点是如何对文本的情感类别进行分类,并提取情感的持有者/目标;2、情绪分析:在阅读给定文本后预测给定文本创作者的情绪;3、情绪原因检测:提取文本中的情感原因。基于文本的情绪处理在NLP中引起了很多关注。大多数研究都集中在情绪检测和分类上,通过识别特定句子或文档的情绪类型,例如幸福和悲伤。然而,除了这个表面平信息之外,需要提取和分析关于情绪的更深层次的信息,例如情绪的体验者,原因和结果,以用于现实世界的应用。例如,了解情绪的存在往往不足以预测未来事件或决定最佳反应。然而,如果除了情绪类型之外还知道情绪原因,则可以更可靠地预测未来事件或评估潜在影响。因而,在上述方案中,通过将用户的对话语句的每个字均以向量方式表示,然后利用情绪分类器通过所述向量语句形式判定语句的用户会话行为类别,最后情绪分配器依据所述用户会话行为类别在预先设置的会话行为与情绪对应表中查询对应于所述用户会话行为类别的情绪分布,以生成最终的所述用户的对话语句的情绪细粒度分布,实现了通过情绪原因推断用户细粒度情绪分布,因而可以更可靠地预测未来事件或评估潜在影响。
[0040] 一个优选方案中,所述情绪分类器在预先构建的用户会话行为数据集上训练得到。
[0041] 在上述方案中,通过将情绪分类器在预先构建的用户会话行为数据集上训练得到,使得情绪分类器能够对用户的对话语句的用户会话行为类别进行可靠和准确的判定。
[0042] 一个优选方案中,所述用户会话行为数据集通过以下方法得到:
[0043] 优选的是,所述的基于用户会话行为的细粒度情绪分析方法中,所述用户会话行为数据集通过以下方法得到:
[0044] S1-1、收集多行业用户与客服的对话语句;
[0045] S1-2、按照预设的分类原则将收集的对话语句进行机器分类;
[0046] S1-3、将经机器分类的对话语句进行人工二次分类和校验;
[0047] S1-4、校验无误后即得到所述用户会话行为数据集。
[0048] 在上述方案中,数据标注是一个费时费的工程。有效标注数据的缺乏是阻碍技术发展的一大障碍,通过机器分类和人工二次分类和质检的方式能够有效的保证得到的数据集的分类的精确性,且大大减少了人工成本。其中,机器分类可以通过文本聚类方法k-means将相似句子聚在一起,然后再利用人工对各类别句子进行标注。聚类方法存在一定的噪音数据,通过再利用人工做数据校对的工作,可以最终得到一个分类明确,数据精确的数据集。
[0049] 通过将用户行为映射到情绪的方式对句子的分析可以不局限于一种情绪。比如用户反映遇到了配送问题,用户有一定的失望与愤怒的情绪,同时由于是配送问题,用户情绪中也有焦虑等待的成分在。通过预测会话行为分类,可以很好的考虑多种情绪并存的情况。
[0050] 通过这种人工定义用户会话行为情绪分值的方式得到的情绪分值相比于其他根据规则计算的方法更加准确;同时,因采用通过情绪原因推断用户细粒度情绪分布,因而对用户的情绪分析不依赖于情感词语,使得所述基于用户会话行为的细粒度情绪分析方法对隐式情感表达同样适用。
[0051] 另外,考虑到不同领域对不同事件细分情绪成分的定义不同,本发明用户会话行为到情绪分值的映射关系可以预先设置,从而实现同一种分类在不同领域的细分情绪浓度值不同,实现根据不同行业不同客户的定制化情绪分析。
[0052] 所述的细粒度情绪分析方法为句子级别的细粒度的情绪分析,即给定一个句子分析这个句子所包含的情绪。通过情绪原因推导情绪成分这一反向思维的方法来完成细粒度情绪识别的任务。之所以说是反向思维是因为研究人员普遍致力于已知情绪值来推测导致情绪的原因(关键词或事件等),或者直接通过句子推测情绪,而很少有人尝试通过情绪原因来映射情绪分值的方法。通过情绪原因推导情绪成分的方式可以将细粒度情绪分析简单化,实现一个情绪分分类器模型完成六种情绪细粒度分析的任务。同时解决多种情绪并存,领域定制化情绪分析,准确的情绪浓度值,隐含情绪分析等问题。
[0053] 例如,在客服行业中,基于客服对话数据的特点与业务需求,在句子级别将用户会话行为细分,如用户在咨询问题,用户在反映问题等,在得到会话行为分类后还可以对每个分类赋予各个情绪的分值。然后构造情绪分类器能够准确的预测用户会话行为。最后将分类结果映射到细分情绪分值得到句子级别的用户情绪分布。比如反映配送问题的用户会话行为类别,例句:我的快递怎么还不到?细粒度情绪分布:愤怒值40,焦虑值70,疑惑值40,失望值40,感激值0,愉快值0。
[0054] 由于现实会话场景复杂多样,用户会话行为种类繁多,所述细粒度情绪分析方法在客服行业可行的原因有:1、由于客服行业用户多为与客服反映问题或者咨询问题并沟通解决,用户情绪表达比较直接,很少存在隐喻、影射等晦涩的表达形式。2、根据业务和客服数据统计,发现客户行业常见会话场景有限,使得将用户会话行为细分变得可能。3、相同场景下细粒度情绪分布差异不大,如用户反映产品问题类,都是因为服务方的产品缺陷导致了用户不好的体验,所以不用区分具体产品具体问题,用户的情绪分布是大致相同的。
[0055] 一个优选方案中,在客服行业中,所述用户会话行为数据集共分为八个大类,八个所述大类包括:情绪正向类、情绪中向类、反映问题类、疑惑类、失望类、质疑类、愤怒类以及焦虑类。
[0056] 一个优选方案中,每个所述大类又依据类别不同分为多个小类。
[0057] 在上述方案中,采用上述方法对客服行业中用户对话句子的情绪成分分析,根据对真实客服数据的分析以及业务需求,用户行为分类的8个大类可以共分为36个小类,其中36类小类分别为:
[0058] 情绪正向类包括:
[0059] 感谢类:用户对客服或公司,公司其他服务人员,公司产品等表达感谢。
[0060] 例子:我试试,很感谢你
[0061] 刚刚收到短信提示。谢谢啦
[0062] 高兴类:用户单纯表达高兴。
[0063] 例子:哈哈哈,我也很高兴
[0064] 祝福类:用户对客服或公司,公司产品等表达祝福。
[0065] 例子:周末愉快。
[0066] 祝贵公司越来越好。
[0067] 正向反馈:用户对客服或公司,公司其他服务人员,公司产品等提出好的评价。
[0068] 例子:是你的服务让我又愉快了
[0069] 我几乎隔两天就买
[0070] 情绪中向类包括:
[0071] 要求类:用户提出合理要求,不包含情绪表达
[0072] 例子:加一下我微信吧
[0073] 麻烦帮我退了
[0074] 咨询类:用户正常咨询关心的问题,不涉及情绪表达
[0075] 例子:你好,问下物理课程
[0076] 发给你就可以是吧
[0077] 陈述类:用户客观陈述某种事实,不涉及情绪表达
[0078] 例子:下午5点后可以来取,现在家里没人
[0079] 我的电话:18833346361
[0080] 反映问题类:用户客观反映遇到的问题,且问题对用户带来了不好的体验。根据问题对象分为:产品或服务问题,系统问题,客服服务问题,配送问题,问题对象不明确;
[0081] 例子:公众号打不开了
[0082] 有一包黄叶菜烂了
[0083] 疑惑类:
[0084] 不懂类:用户单纯表达对某些事情不明白
[0085] 例子:啥意思?
[0086] 这个我不会呀
[0087] 疑问类:因为某些事情用户表示疑问
[0088] 例子:实名信息被占用是怎么回事
[0089] 失望类:
[0090] 不会使用类:用户表达不会再购买产品或者使用服务
[0091] 例子:以后不会再来了
[0092] 消极接受结果类:用户对服务结果不满意,但又不愿进一步纠缠例子:这次就算了,下次改善吧
[0093] 质疑类:
[0094] 否认类:用户否认客服或者系统对用户的评价或定性
[0095] 例子:我没有逾期过
[0096] 强调陈述类:用户强调某些事实以突出服务的错误处
[0097] 例子:我明明买的是面粉
[0098] 反问类:用户反问客服
[0099] 例子:不是说会员一小时吗
[0100] 不满询问类:用户的询问中透露着对服务的不满:
[0101] 例子:怎么就不符合了
[0102] 焦虑类:
[0103] 负向叮嘱类:用户由于担心发生问题而叮嘱的行为
[0104] 例子:别又送错了
[0105] 担心类:用户单纯表达对某些事物的担心
[0106] 例子:现在有点担心,怕这是一家高利贷贷款平台
[0107] 配送问题类:用户由于配送出问题而产生焦虑情绪
[0108] 例子:说好的会员一小时送到,24小时过去了
[0109] 还没完成类:用户抱怨事情很久也没有完成
[0110] 例子:怎么还没送达
[0111] 有急事类:用户表达事情紧急
[0112] 例子:我这着急买东西呢
[0113] 催促类:用户对客服,物流等催促
[0114] 例子:赶紧让人拿走吧
[0115] 愤怒类:
[0116] 情绪化表达类:
[0117] 例子:5个小时能做好多事情你知道吗?
[0118] 对客服强烈不满类:用户跟客服交流中对客服某些行为表达不满
[0119] 例子:你们听不懂人话吗
[0120] 超时等待类:用户表达已经对快递或者服务已经等很久了
[0121] 例子:我已经等了5个小时了
[0122] 投诉类:用户表示会到有关部投诉或举报
[0123] 例子:我要投诉之前的客服
[0124] 带负面情绪的要求类:用户提出要求但是明显含有负面情绪
[0125] 例子:别给我这么官方的说辞
[0126] 差评类:用户对服务或产品提出差评或者抱怨
[0127] 例子:你们这么大个平台有你们这样忽悠人的吗
[0128] 暴怒类:用户表达中含有谩骂词语
[0129] 例子:你他妈的给我滚。
[0130] 一个优选方案中,所述情绪细粒度分布包括多种情绪各自的浓度值。
[0131] 在上述方案中,通过对用户会话行为各类别预先分配细粒度情绪浓度值的方式解决一句话中多种情绪并存的问题。且通过用户会话行为各类别浓度值的设置,客户可自定义的方式实现对不同领域情绪浓度定制化。
[0132] 一个优选方案中,所述浓度值指愤怒、焦虑、疑惑、失望、感激以及愉快6个维度的细分情绪的浓度值。
[0133] 实施例
[0134] 将所述基于用户会话行为的细粒度情绪分析方法应用于客服行业中对用户对话句子的情绪成分分析。首先探索一个用户会话行为分类体系能够将客服对话中用户所有会话行为分门别类,并对每类赋予细分情绪浓度值,然后通过情绪分类器将用户行为预测出来,最后映射得到细分情绪分值。
[0135] 第一、通过文本聚类方法k-means将相似句子聚在一起然后人工对各类别句子进行标注,而后采用人工对标注后的各类别的句子做数据校对的工作,最终的到了一个分类明确,数据精确地客服领域基于用户会话行为分类的数据集。数据集共8大类,36小类,8万条数据。
[0136] 第二、根据对真实客服数据的分析以及业务需求,用户行为分类体系的8大类分别为:情绪正向类,情绪中向类,反映问题类,疑惑类,失望类,质疑类,愤怒类,焦虑类。
[0137] 第三、选择Bert模型加单层神经网络的情绪分类器。Bert模型是18年谷歌提出的通过在大量文本数据上预训练然后再在特定任务数据上微调的方法。通过在Bert模型上加一个单层神经网络构成的用户会话行为情绪分类器具备很好的分类能力。
[0138] 第四、利用该模型首先用户对话语句对每个字用向量的方式表示。通过用户会话行为情绪分类器得到该句的用户会话行为类别,分类结果具体到上述36个类别中的一类。根据分类结果情绪情绪分配器会到预先设置的用户会话行为与情绪对应表查询该类别的情绪分布,并生成最终的用户语句的情绪细粒度分布,该分布包括六种情绪各自的浓度值。
[0139] 通过训练,该分类模型在1万条测试数据上达到87%正确率的用户会话行为分类效果。
[0140] 尽管本发明的实施方案已公开如上,但其并不仅仅限于说明书和实施方式中所列运用,它完全可以被适用于各种适合本发明的领域,对于熟悉本领域的人员而言,可容易地实现另外的修改,因此在不背离权利要求及等同范围所限定的一般概念下,本发明并不限于特定的细节和这里所示出与描述的图例。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈