首页 / 专利库 / 软件 / 软件 / 一种APP软件用户评论一致性判断方法

一种APP软件用户评论一致性判断方法

阅读:179发布:2021-06-04

专利汇可以提供一种APP软件用户评论一致性判断方法专利检索,专利查询,专利分析的服务。并且本 发明 涉及一种APP 软件 用户评论一致性判断方法,属于APP软件用户评价领域。本发明首先提取APP软件特征情感词对集;然后计算提取的APP软件特征情感词对集中情感词对的情感倾向程度得分;最后判断情感倾向程度得分是否存在不等于零的情况来确定APP软件用户评论是否一致。本发明定义并提取APP软件特征情感词对集,有助于更准确的判断用户评论信息与评分星级的一致性;将用户对APP软件的情感倾向程度划分成与评分星级对应的5个等级,以判断APP软件用户评论的一致性,有助于用户选择满足需求的APP软件;通过判断APP软件用户评论的一致性,有助于用户评价APP软件的 质量 。,下面是一种APP软件用户评论一致性判断方法专利的具体信息内容。

1.一种APP软件用户评论一致性判断方法,其特征在于:
首先提取APP软件特征情感词对集;然后计算提取的APP软件特征情感词对集中情感词对的情感倾向程度得分;最后判断情感倾向程度得分是否存在不等于零的情况来确定APP软件用户评论是否一致;
所述方法的具体步骤如下:
Step1、提取APP软件特征情感词对集F={f1,f2,...,fx};其中fx=(Wh,Wd,Wa)表示APP软件特征情感词对,Wh表示评论用户关注的APP软件特征词,Wa为修饰特征Wh的情感词,Wd为修饰情感词Wa的副词, x=1,2,...,u;
Step2、设置x=1;
Step3、判断x是否小于或等于u:如果是,则执行步骤Step4;否则,执行步骤Step11;
Step4、判断fx中的Wh是否为空:如果是,则执行步骤Step6;否则,执行步骤Step5;
Step5、判断Wh是否属于集合U:如果是,则执行步骤Step6;否则,计算Wh与集合U中每个词或词组的相似度a:如果amax>=α,则执行步骤Step6,否则,将fx的情感倾向程度得分F(x)赋值为0,x++,执行Step3;
Step6、判断fx中的Wa是否为自定义网络情感词:如果是,则与自定义网络情感词库匹配,并根据公式F(x)=F(d)*F(z)计算F(x),x++,执行Step3;否则,执行Step7;
Step7、判断Wd是否为空:如果是,则与《How Net》词典匹配,并根据公式F(x)=F(a)*F(d)*F(n)计算F(x),x++,执行Step3;否则,执行Step8;
Step8、判断fx是否含否定副词:如果不含,则与《How Net》词典匹配,并根据公式F(x)=F(a)*F(d)计算F(x),x++,执行Step3;否则,执行Step9;
Step9、判断fx是否含程度副词:如果不含,则与《How Net》词典匹配,并根据公式F(x)=-0.5*F(a)计算F(x),x++,执行Step3;否则,执行Step10;
Step10、判断fx是否属于DNP形式:如果不属于,则与《How Net》词典匹配,并根据公式F(x)=0.6*F(d)*F(a)计算否定副词在程度副词之前的情感倾向程度得分F(x),x++,执行Step3;否则,根据公式F(x)=-0.5*F(d)*F(a)计算程度副词在否定副词之前的情感倾向程度得分F(x),x++,执行Step3;
Step11、判断是否存在F(x)!=0:
如果存在F(x)!=0,则根据公式 计算出用户对该APP软件每条评论的综合评分F(O),再根据用户给APP软件所打的5个评分星级将综合评分F(O)划分成对应的5个等级,如果量化后的评分星级与用户的评分星级相同,则输出“APP软件用户评论一致”,否则输出“APP软件用户评论不一致”;
如果不存在F(x)!=0,则输出“APP软件用户评论不一致”;
式中,U表示APP软件信息中特征集合,amax表示相似度a的最大值,α表示阈值且α=0.1;
F(x)表示用户评论中对第x个特征评论的情感倾向程度得分,t表示APP软件特征情感词对集F中F(x)!=0的个数;F(d)为程度副词的极性参数:若存在程度副词,F(d)取值根据程度副词极性参数类别确定,若不存在程度副词,F(d)取值为1;F(n)为否定副词的极性参数:若存在否定副词,F(n)取值为-0.5,若不存在否定副词,F(n)取值为1;F(a)为情感词的原极性参数:如果情感词为正面,F(a)取值为1,如果情感词为反面,F(a)取值为-1,如果情感词为中性,F(a)的取值为0.1;F(z)表示自定义网络情感词语库中情感词的原极性参数:如果自定义网络情感词语库中情感词为正面,F(z)取值为1.6,如果自定义网络情感词语库中情感词为反面,F(z)取值为-1.6。
2.根据权利要求1所述的APP软件用户评论一致性判断方法,其特征在于:所述程度副词极性参数类别分别五类:第一类,F(d)取值为1.6;第二类,F(d)取值为1.4;第三类,F(d)取值为1.2;第四类,F(d)取值为0.8;第五类,F(d)取值为0.6。
3.根据权利要求1所述的APP软件用户评论一致性判断方法,其特征在于:所述5个评分星级对应的F(O)取值区间:5星,取值区间为(1,1.6];4星,取值区间为[0.5,1];3星,取值区间为(-0.5,0.5);2星,取值区间为[-1,-0.5];1星,取值区间为[-1.6,-1)。

说明书全文

一种APP软件用户评论一致性判断方法

技术领域

[0001] 本发明涉及一种APP软件用户评论一致性判断方法,属于APP软件用户评价领域。

背景技术

[0002] 用户评论信息分析方法在商品领域日趋成熟,多数研究主要使用ICTCLAS作为用户评论信息数据处理的工具,最后通过自然语言处理等方法来对用户评论信息进行分析。例如,朱征宇等人提出一种改进《知网》的词汇语义相似度计算方法;尹洪波等人提出当否定副词与程度副词共现时,句法语义可以相互推衍的规则;扈中凯等人通过对特征词和情感词同时提取,并建立用户兴趣偏好模型,结合用户历史评分数据来改善传统协同过滤推荐算法的推荐准确性;林钦和等人通过基于《How Net》词典的程度语料库,设置6种类别的程度副词,并定义5种极性参数来计算用户对产品的不同态度。上述研究针对商品的用户评论信息进行挖掘和分析,将用户的情感倾向分为了正面反面、中性三个方面。
[0003] 目前,面对海量的移动应用,大多数用户在选择APP软件之前会查看APP软件信息和用户评论。用户评论包括用户给APP软件所打的评分星级(通常为5个等级),以及描述使用APP软件后的评论信息。用户的评论信息往往隐含了用户对APP软件的喜好程度及对软件特定属性的关注程度等潜在信息。然而,由于网络评论的自由性和随意性,导致评论信息与所给的评分星级不一致,或者评论信息与APP软件信息不一致。这给用户评价APP软件的质量带来了困难,因此如何判断APP软件的用户评论是否一致成为需要解决的问题。
[0004] 本发明提出通过提取用户评论信息中的APP软件特征情感词对集,量化用户对APP软件特征情感倾向程度,并将量化后的综合评分划分成5个等级等方法来判断APP软件用户评论的一致性,有助于用户选择满足需求的APP软件。

发明内容

[0005] 针对上述问题,本发明提供了一种APP软件用户评论一致性判断方法,以用于帮助用户选择所需的APP软件。
[0006] 本发明的技术方案是:一种APP软件用户评论一致性判断方法,首先提取APP软件特征情感词对集;然后计算提取的APP软件特征情感词对集中情感词对的情感倾向程度得分;最后判断情感倾向程度得分是否存在不等于零的情况来确定APP软件用户评论是否一致。
[0007] 所述方法的具体步骤如下:
[0008] Step1、提取APP软件特征情感词对集F={f1,f2,...,fx};其中fx=(Wh,Wd,Wa)(x=1,2,...,u)表示APP软件特征情感词对,Wh表示评论用户关注的APP软件特征词,Wa为修饰特征Wh的情感词,Wd为修饰情感词Wa的副词;
[0009] Step2、设置x=1;
[0010] Step3、判断x是否小于或等于u:如果是,则执行步骤Step4;否则,执行步骤Step11;
[0011] Step4、判断fx中的Wh是否为空:如果是,则执行步骤Step6;否则,执行步骤Step5;
[0012] Step5、判断Wh是否属于集合U:如果是,则执行步骤Step6;否则,计算Wh与集合U中每个词或词组的相似度a:如果amax>=α,则执行步骤Step6,否则,将fx的情感倾向程度得分F(x)赋值为0,x++,执行Step3;
[0013] Step6、判断fx中的Wa是否为自定义网络情感词:如果是,则与自定义网络情感词库匹配,并根据公式F(x)=F(d)*F(z)计算F(x),x++,执行Step3;否则,执行Step7;
[0014] Step7、判断Wd是否为空:如果是,则与《How Net》词典匹配,并根据公式F(x)=F(a)*F(d)*F(n)计算F(x),x++,执行Step3;否则,执行Step8;
[0015] Step8、判断fx是否含否定副词:如果不含,则与《How Net》词典匹配,并根据公式F(x)=F(a)*F(d)计算F(x),x++,执行Step3;否则,执行Step9;
[0016] Step9、判断fx是否含程度副词:如果不含,则与《How Net》词典匹配,并根据公式F(x)=-0.5*F(a)计算F(x),x++,执行Step3;否则,执行Step10;
[0017] Step10、判断fx是否属于DNP形式:如果不属于,则与《How Net》词典匹配,并根据公式F(x)=0.6*F(d)*F(a)计算否定副词在程度副词之前的情感倾向程度得分F(x),x++,执行Step3;否则,根据公式F(x)=-0.5*F(d)*F(a)计算程度副词在否定副词之前的情感倾向程度得分F(x),x++,执行Step3;
[0018] Step11、判断是否存在F(x)!=0:
[0019] 如果存在F(x)!=0,则根据公式 计算出用户对该APP软件每条评论的综合评分F(O),再根据用户给APP软件所打的5个评分星级将综合评分F(O)划分成对应的
5个等级,如果量化后的评分星级与用户的评分星级相同,则输出“APP软件用户评论一致”,否则输出“APP软件用户评论不一致”;
[0020] 如果不存在F(x)!=0,则输出“APP软件用户评论不一致”;
[0021] 式中,U表示APP软件信息中特征集合,amax表示相似度a的最大值,α表示阈值且α=0.1;F(x)表示用户评论中对第x个特征评论的情感倾向程度得分,t表示APP软件特征情感词对集F中F(x)!=0的个数;F(d)为程度副词的极性参数:若存在程度副词,F(d)取值根据程度副词极性参数类别确定,若不存在程度副词,F(d)取值为1;F(n)为否定副词的极性参数:若存在否定副词,F(n)取值为-0.5,若不存在否定副词,F(n)取值为1;F(a)为情感词的原极性参数:如果情感词为正面,F(a)取值为1,如果情感词为反面,F(a)取值为-1,如果情感词为中性,F(a)的取值为0.1;F(z)表示自定义网络情感词语库中情感词的原极性参数:
如果自定义网络情感词语库中情感词为正面,F(z)取值为1.6,如果自定义网络情感词语库中情感词为反面,F(z)取值为-1.6。
[0022] 所述程度副词极性参数类别分别五类:第一类,F(d)取值为1.6;第二类,F(d)取值为1.4;第三类,F(d)取值为1.2;第四类,F(d)取值为0.8;第五类,F(d)取值为0.6。
[0023] 所述5个评分星级对应的F(O)取值区间:5星,取值区间为(1,1.6];4星,取值区间为[0.5,1];3星,取值区间为(-0.5,0.5);2星,取值区间为[-1,-0.5];1星,取值区间为[-1.6,-1)。
[0024] 其中,情感词的正面、反面、中性根据《How Net》词典匹配。
[0025] 本发明的工作原理是:
[0026] 一种APP软件用户评论一致性判断方法,包括:
[0027] 提取APP软件特征情感词对集,用于对用户评论信息中的非结构化数据进行相应的数据处理并提取APP软件特征情感词对集;
[0028] 判断用户评论信息与APP软件信息的一致性,用于判断用户评论信息中APP软件特征情感词对集中的特征是否与当前APP软件信息特征一致;
[0029] 判断用户评论信息与评分星级的一致性,用于判断用户评论信息中用户对APP软件特征的情感倾向程度综合评分是否与用户对APP软件所给的评分星级一致。
[0030] 本发明使用ICTCLAS 2015作为数据处理的工具,进行用户评论信息的分词及词性标注;基于扈中凯等人对特征词、情感词同时提取的方法,本发明对特征词、副词、情感词进行同时提取,即提取APP软件特征情感词对集F。
[0031] 所述U表示APP软件信息中特征集合,amax表示相似度a的最大值,α表示阈值且α=0.1,相似度计算使用的是朱征宇等人提出的改进《知网》的词汇语义相似度计算方法,计算公式如下:
[0032] Sim(W1,W2)=max(Sim(C1i,C2j))
[0033] 其中:i=1,2,...,n,j=1,2,...,m,Sim(W1,W2)为词汇W1与W2之间的相似度值,Sim(C1i,C2j)为概念C1i与C2j之间的概念相似度值。
[0034] APP软件用户评论是一种典型的网络评论,用户往往会使用许多网络情感词语。目前,词典不能识别这部分网络情感词,但这些词语又能表达用户对APP软件一个或多个特征的态度,从而对APP软件用户评论一致性的判断造成影响。因此,本发明建立了自定义网络情感词语库,如:TMD/n_newword、狗屎/n_newword、神器/n_newword、逼/n_newword等,并对这部分情感词进行权重极性的定义。这类词语大多表现为用户对APP软件的一个或多个特征持非常强烈的态度。
[0035] 本发明基于《How Net》词典的程度语料库,将林钦和等人的6种类别程度副词中极性参数相同的类别进行合并,最终分为5种不同极性参数的类别,如表1所示。
[0036] 表1程度副词分类及极性参数表
[0037]
[0038] 对于否定副词的处理,本发明首先设置否定副词的极性参数为-0.5,由于否定副词和程度副词共现语序情况可分为两种:1)程度副词在否定副词之前,是对否定副词所否定程度的确定,否定程度是逐渐递增的,例如:“画面不好”和“画面很不好”;2)否定副词在程度副词之前,是对某个程度的否定,作用是把原来的程度降低,例如:“画面不非常好”和“画面相对好”,这两个例句表达的情感倾向程度大体相同。这种情况根据尹洪波等人提出的在语义上能够相互推衍的,基于以上规则,根据公式F(x)=0.6*F(d)*F(a)计算否定副词在程度副词之前的情感倾向程度得分F(x);根据公式F(x)=-0.5*F(d)*F(a)计算程度副词在否定副词之前的情感倾向程度得分F(x)。
[0039] 所述将综合评分F(O)划分成对应的5个等级的划分过程:由上述过程可以计算出综合评分F(O)的取值范围是[-1.6,+1.6],因为从表2中可以看出极性参数的最大值是1.6,正面、反面情感词的极性分别为+1、-1,且本专利中的否定副词极性参数为-0.5。所以5星中最大取值为1.6*1=1.6;4星的最大取值为1,最小值为-1*(-0.5)=0.5,即5星的取值区间为(1,1.6],4星的取值区间为[0.5,1]。用户综合评分划分区间如表2所示。
[0040] 表2用户综合评分划分区间
[0041]
[0042] 本发明的有益效果是:
[0043] (1)本发明定义并提取APP软件特征情感词对集,有助于更准确的判断用户评论信息与评分星级的一致性;
[0044] (2)本发明将用户对APP软件的情感倾向程度划分成与评分星级对应的5个等级,以判断APP软件用户评论的一致性,有助于用户选择满足需求的APP软件;
[0045] (3)本发明通过判断APP软件用户评论的一致性,有助于用户评价APP软件的质量。附图说明
[0046] 图1是本发明的流程图

具体实施方式

[0047] 实施例1:如图1所示,一种APP软件用户评论一致性判断方法,首先提取APP软件特征情感词对集;然后计算提取的APP软件特征情感词对集中情感词对的情感倾向程度得分;最后判断情感倾向程度得分是否存在不等于零的情况来确定APP软件用户评论是否一致。
[0048] 所述方法的具体步骤如下:
[0049] Step1、提取APP软件特征情感词对集F={f1,f2,...,fx};其中fx=(Wh,Wd,Wa)(x=1,2,...,u)表示APP软件特征情感词对,Wh表示评论用户关注的APP软件特征词,Wa为修饰特征Wh的情感词,Wd为修饰情感词Wa的副词;
[0050] Step2、设置x=1;
[0051] Step3、判断x是否小于或等于u:如果是,则执行步骤Step4;否则,执行步骤Step11;
[0052] Step4、判断fx中的Wh是否为空:如果是,则执行步骤Step6;否则,执行步骤Step5;
[0053] Step5、判断Wh是否属于集合U:如果是,则执行步骤Step6;否则,计算Wh与集合U中每个词或词组的相似度a:如果amax>=α,则执行步骤Step6,否则,将fx的情感倾向程度得分F(x)赋值为0,x++,执行Step3;
[0054] Step6、判断fx中的Wa是否为自定义网络情感词:如果是,则与自定义网络情感词库匹配,并根据公式F(x)=F(d)*F(z)计算F(x),x++,执行Step3;否则,执行Step7;
[0055] Step7、判断Wd是否为空:如果是,则与《How Net》词典匹配,并根据公式F(x)=F(a)*F(d)*F(n)计算F(x),x++,执行Step3;否则,执行Step8;
[0056] Step8、判断fx是否含否定副词:如果不含,则与《How Net》词典匹配,并根据公式F(x)=F(a)*F(d)计算F(x),x++,执行Step3;否则,执行Step9;
[0057] Step9、判断fx是否含程度副词:如果不含,则与《How Net》词典匹配,并根据公式F(x)=-0.5*F(a)计算F(x),x++,执行Step3;否则,执行Step10;
[0058] Step10、判断fx是否属于DNP形式:如果不属于,则与《How Net》词典匹配,并根据公式F(x)=0.6*F(d)*F(a)计算否定副词在程度副词之前的情感倾向程度得分F(x),x++,执行Step3;否则,根据公式F(x)=-0.5*F(d)*F(a)计算程度副词在否定副词之前的情感倾向程度得分F(x),x++,执行Step3;
[0059] Step11、判断是否存在F(x)!=0:
[0060] 如果存在F(x)!=0,则根据公式 计算出用户对该APP软件每条评论的综合评分F(O),再根据用户给APP软件所打的5个评分星级将综合评分F(O)划分成对应的
5个等级,如果量化后的评分星级与用户的评分星级相同,则输出“APP软件用户评论一致”,否则输出“APP软件用户评论不一致”;
[0061] 如果不存在F(x)!=0,则输出“APP软件用户评论不一致”;
[0062] 式中,U表示APP软件信息中特征集合,amax表示相似度a的最大值,α表示阈值且α=0.1;F(x)表示用户评论中对第x个特征评论的情感倾向程度得分,t表示APP软件特征情感词对集F中F(x)!=0的个数;F(d)为程度副词的极性参数:若存在程度副词,F(d)取值根据程度副词极性参数类别确定,若不存在程度副词,F(d)取值为1;F(n)为否定副词的极性参数:若存在否定副词,F(n)取值为-0.5,若不存在否定副词,F(n)取值为1;F(a)为情感词的原极性参数:如果情感词为正面,F(a)取值为1,如果情感词为反面,F(a)取值为-1,如果情感词为中性,F(a)的取值为0.1;F(z)表示自定义网络情感词语库中情感词的原极性参数:
如果自定义网络情感词语库中情感词为正面,F(z)取值为1.6,如果自定义网络情感词语库中情感词为反面,F(z)取值为-1.6。
[0063] 所述程度副词极性参数类别分别五类:第一类,F(d)取值为1.6;第二类,F(d)取值为1.4;第三类,F(d)取值为1.2;第四类,F(d)取值为0.8;第五类,F(d)取值为0.6。
[0064] 所述5个评分星级对应的F(O)取值区间:5星,取值区间为(1,1.6];4星,取值区间为[0.5,1];3星,取值区间为(-0.5,0.5);2星,取值区间为[-1,-0.5];1星,取值区间为[-1.6,-1)。
[0065] 实施例2:如图1所示,一种APP软件用户评论一致性判断方法,首先提取APP软件特征情感词对集;然后计算提取的APP软件特征情感词对集中情感词对的情感倾向程度得分;最后判断情感倾向程度得分是否存在不等于零的情况来确定APP软件用户评论是否一致。
[0066] 所述方法的具体步骤如下:
[0067] Step1、提取APP软件特征情感词对集F={f1,f2,...,fx};其中fx=(Wh,Wd,Wa)(x=1,2,...,u)表示APP软件特征情感词对,Wh表示评论用户关注的APP软件特征词,Wa为修饰特征Wh的情感词,Wd为修饰情感词Wa的副词;
[0068] Step2、设置x=1;
[0069] Step3、判断x是否小于或等于u:如果是,则执行步骤Step4;否则,执行步骤Step11;
[0070] Step4、判断fx中的Wh是否为空:如果是,则执行步骤Step6;否则,执行步骤Step5;
[0071] Step5、判断Wh是否属于集合U:如果是,则执行步骤Step6;否则,计算Wh与集合U中每个词或词组的相似度a:如果amax>=α,则执行步骤Step6,否则,将fx的情感倾向程度得分F(x)赋值为0,x++,执行Step3;
[0072] Step6、判断fx中的Wa是否为自定义网络情感词:如果是,则与自定义网络情感词库匹配,并根据公式F(x)=F(d)*F(z)计算F(x),x++,执行Step3;否则,执行Step7;
[0073] Step7、判断Wd是否为空:如果是,则与《How Net》词典匹配,并根据公式F(x)=F(a)*F(d)*F(n)计算F(x),x++,执行Step3;否则,执行Step8;
[0074] Step8、判断fx是否含否定副词:如果不含,则与《How Net》词典匹配,并根据公式F(x)=F(a)*F(d)计算F(x),x++,执行Step3;否则,执行Step9;
[0075] Step9、判断fx是否含程度副词:如果不含,则与《How Net》词典匹配,并根据公式F(x)=-0.5*F(a)计算F(x),x++,执行Step3;否则,执行Step10;
[0076] Step10、判断fx是否属于DNP形式:如果不属于,则与《How Net》词典匹配,并根据公式F(x)=0.6*F(d)*F(a)计算否定副词在程度副词之前的情感倾向程度得分F(x),x++,执行Step3;否则,根据公式F(x)=-0.5*F(d)*F(a)计算程度副词在否定副词之前的情感倾向程度得分F(x),x++,执行Step3;
[0077] Step11、判断是否存在F(x)!=0:
[0078] 如果存在F(x)!=0,则根据公式 计算出用户对该APP软件每条评论的综合评分F(O),再根据用户给APP软件所打的5个评分星级将综合评分F(O)划分成对应的
5个等级,如果量化后的评分星级与用户的评分星级相同,则输出“APP软件用户评论一致”,否则输出“APP软件用户评论不一致”;
[0079] 如果不存在F(x)!=0,则输出“APP软件用户评论不一致”;
[0080] 式中,U表示APP软件信息中特征集合,amax表示相似度a的最大值,α表示阈值且α=0.1;F(x)表示用户评论中对第x个特征评论的情感倾向程度得分,t表示APP软件特征情感词对集F中F(x)!=0的个数;F(d)为程度副词的极性参数:若存在程度副词,F(d)取值根据程度副词极性参数类别确定,若不存在程度副词,F(d)取值为1;F(n)为否定副词的极性参数:若存在否定副词,F(n)取值为-0.5,若不存在否定副词,F(n)取值为1;F(a)为情感词的原极性参数:如果情感词为正面,F(a)取值为1,如果情感词为反面,F(a)取值为-1,如果情感词为中性,F(a)的取值为0.1;F(z)表示自定义网络情感词语库中情感词的原极性参数:
如果自定义网络情感词语库中情感词为正面,F(z)取值为1.6,如果自定义网络情感词语库中情感词为反面,F(z)取值为-1.6。
[0081] 实施例3:如图1所示,一种APP软件用户评论一致性判断方法,首先提取APP软件特征情感词对集;然后计算提取的APP软件特征情感词对集中情感词对的情感倾向程度得分;最后判断情感倾向程度得分是否存在不等于零的情况来确定APP软件用户评论是否一致。
[0082] 实施例4:如图1所示,
[0083] APP软件用户评论如表3所示,
[0084] 表3
[0085]
[0086] 所述APP软件用户评论一致性判断方法的具体步骤如下:
[0087] Step1、提取APP软件特征情感词对集F={f1,f2,...,fx};其中fx=(Wh,Wd,Wa)(x=1,2,...,u)表示APP软件特征情感词对,Wh表示评论用户关注的APP软件特征词,如“下载”、“画面”等;Wa为修饰特征Wh的情感词,表达了用户对APP软件特征的主观感受,如“麻烦”、“流畅”等;Wd为修饰情感词Wa的副词,表达了用户对特征情感的程度,如“很”、“非常”等。
[0088] 本发明使用ICTCLAS 2015作为数据处理的工具,进行用户评论信息的分词及词性标注;基于扈中凯等人对特征词、情感词同时提取的方法,本发明对特征词、副词、情感词进行同时提取,即提取APP软件特征情感词对集F。本实施例中对用户评论信息分词之后为:“呵呵/o交换机/n”,提取特征情感词对集:F={f1}。
[0089] Step2、设置x=1;
[0090] f1=(交换机/n,null,null)。
[0091] Step3、判断x是否小于或等于u:本实施例中1<=1,执行步骤Step4;
[0092] Step4、判断fx中的Wh是否为空:本实施例Wh为“交换机”,执行步骤Step5;
[0093] Step5、判断Wh是否属于集合U:本实施例中Wh不属于该APP软件信息特征集合U={QQ/n,软件/n,帮助/vn,彩铃/n,超过/v,充/v,触/v,传输/vn,创新/vi,打造/v,电脑/n,动态/n,反馈/v,方便/v,分享/v,服务/vn,感动/v,个性/n,功能/n,沟通/v,购/vg,过程/n,好友/n,互联网/n,话费/n,获知/v,进入/v,空间/n,联系/v,聊天/vi,留住/v,满足/v,名片/n,气泡/n,全民/n,热线/n,人/n,设置/v,生活/vn,时间/n,使用/v,视频/n,收发/v,收款/vn,手机/n,体验/vn,停/vi,通话/vi,文件/n,问题/n,无限/vi,相见/vi,想念/v,消息/n,需/v,选/v,一应俱全/v,移动/vn,用户/n,游戏/n,娱乐/vn,语音/n,遇到/v,支付/v,中心/n,主题/n,转账/vn,装扮/v},因此,根据公式:Sim(W1,W2)=max(Sim(C1i,C2j))计算出Wh与U中每个特征词的相似度a,最后得出相似度a中的最大值amax=0.05;由于amax<α,阈值α=0.1,因此,将f1的情感倾向程度得分F(1)赋值为0,x=2,执行Step3:2>1,执行执行Step6;
[0094] Step6、判断是否存在F(x)!=0:本实施例中不存在F(x)!=0,因此输出“APP软件用户评论不一致”。
[0095] 实施例5:如图1所示,APP软件用户评论如表4所示,
[0096] 表4
[0097]
[0098] 所述APP软件用户评论一致性判断方法的具体步骤如下:
[0099] Step1、提取APP软件特征情感词对集F={f1,f2,...,fx}:
[0100] 本实施例中特征情感词对集:F={f1,f2},f1=(null,null,(好/a用/v)),f2=(迅雷/nz,null,好/a);
[0101] Step2、设置x=1;
[0102] f1=(null,null,(好/a用/v))。
[0103] Step3、判断x是否小于或等于u:本实施例中1<=2,执行步骤Step4;
[0104] Step4、判断fx中的Wh是否为空:本实施例Wh为空,执行步骤Step5;
[0105] Step5、判断fx中的Wa是否为自定义网络情感词:本实施例中Wa为“好用”,不属于自定义网络情感词,执行Step6;
[0106] Step6、判断Wd是否为空:本实施例中Wd为空,则与《How Net》词典匹配,并根据公式F(x)=F(a)*F(d)*F(n)(其中,情感词的正面、反面、中性根据《How Net》词典匹配,从而确定F(a)的取值)计算出F(1)的评分:F(1)=1*1*1=1,x=2,执行Step3:2<=2,执行步骤Step4;
[0107] 判断fx中的Wh是否为空:本实施例f2中Wh为“迅雷”,判断Wh是否属于集合U:本实施例中Wh不属于该APP软件信息特征集合U={百度/nz,视频/n,想/v,看/v,有/v,观看/v,离线/vn,视频/n,享受/v,片/n,APP/n,够/v,电影/n,播/v,剧/n,动漫/vn,节目/n,应有尽有/v,搜索/vn,个性化/vn,推荐/vn能/v,找到/v,装/v,采用/v,独有/v,移动/vn,/n,播放/v,内核/n,技术/n,播放/v,加载/v,速度/n},因此,根据公式:Sim(W1,W2)=max(Sim(C1i,C2j))计算出Wh与U中每个特征词的相似度a,最后得出相似度a中的最大值amax=0.08;由于amax<α,阈值α=0.1,因此,将f2的情感倾向程度得分F(2)赋值为0,x=3,执行Step3:3>2,执行执行Step7;
[0108] Step7、判断是否存在F(x)!=0:本实施例中存在F(1)=1,根据公式计算出综合评分F(O)=1/1=1,最后根据表2得出量化后的评分星级为4星,但用户给出的评分星级是5星。因此,输出“APP软件用户评论不一致”。
[0109] 实施例6:如图1所示,APP软件用户评论如表5所示,
[0110] 表5
[0111]
[0112] 所述APP软件用户评论一致性判断方法的具体步骤如下:
[0113] Step1、提取APP软件特征情感词对集F={f1,f2,...,fx}:
[0114] 本实施例中对用户评论信息分词之后为:“TMD/n_newword不/d好/a!/wt”,提取特征情感词对集:F={f1},f1=(null,不/d,(TMD/n_newword好/a))。
[0115] Step2、设置x=1;
[0116] f1=(null,不/d,(TMD/n_newword好/a)。
[0117] Step3、判断x是否小于或等于u:本实施例中1<=1,执行步骤Step4;
[0118] Step4、判断fx中的Wh是否为空:本实施例Wh为空,执行步骤Step5;
[0119] Step5、判断fx中的Wa是否为自定义网络情感词:本实施例中Wa为“TMD/n_newword好”,属于自定义网络情感词,则与自定义网络情感词库匹配,并根据公式F(x)=F(d)*F(z)计算出F(1)的评分:F(1)=1*(-1.6)=-1.6,x=2,执行Step3:2>1,执行步骤Step6;
[0120] Step6、判断是否存在F(x)!=0:本实施例中存在F(1)=-1.6,根据公式计算出综合评分F(O)=-1.6/1=-1.6;最后根据表2得出量化后的评分星级为1星,用户给出的评分星级是1星。因此,输出“APP软件用户评论一致”。
[0121] 实施例7:如图1所示,APP软件用户评论如表6所示,
[0122] 表6
[0123]
[0124] 所述APP软件用户评论一致性判断方法的具体步骤如下:
[0125] Step1、提取APP软件特征情感词对集F={f1,f2,...,fx}:
[0126] 本实施例中对用户评论信息分词之后为:“SB/n_newword软件/n”,提取特征情感词对集:F={f1},f1=(软件/n,null,SB/n_newword))。
[0127] Step2、设置x=1;
[0128] f1=(软件/n,null,SB/n_newword)。
[0129] Step3、判断x是否小于或等于u:本实施例中1<=1,执行步骤Step4;
[0130] Step4、判断fx中的Wh是否为空:本实施例Wh为“软件”,执行步骤Step5;
[0131] Step5、判断Wh是否属于集合U:本实施例Wh为“软件”属于U,执行步骤Step6;
[0132] Step6、判断fx中的Wa是否为自定义网络情感词:本实施例中Wa为“SB”,属于自定义网络情感词,则与自定义网络情感词库匹配,并根据公式F(x)=F(d)*F(z)计算出F(1)的评分:F(1)=1*(-1.6)=-1.6,x=2,执行Step3:2>1,执行步骤Step7;
[0133] Step7、判断是否存在F(x)!=0:本实施例中存在F(1)=-1.6,根据公式计算出综合评分F(O)=-1.6/1=-1.6;最后根据表2得出量化后的评分星级为1星,用户给出的评分星级是1星。因此,输出“APP软件用户评论一致”。
[0134] 实施例8:如图1所示,APP软件用户评论如表7所示,
[0135] 表7
[0136]
[0137] 所述APP软件用户评论一致性判断方法的具体步骤如下:
[0138] Step1、提取APP软件特征情感词对集F={f1,f2,...,fx}:
[0139] 本实施例中特征情感词对集:F={f1},f1=(安/v,很/d,慢/a);
[0140] Step2、设置x=1;
[0141] f1=(安/v,很/d,慢/a)。
[0142] Step3、判断x是否小于或等于u:本实施例中1<=1,执行步骤Step4;
[0143] Step4、判断fx中的Wh是否为空:本实施例Wh为“安”,执行步骤Step5;
[0144] Step5、判断Wh是否属于集合U:本实施例Wh为“安”不属于U,因此,根据公式:Sim(W1,W2)=max(Sim(C1i,C2j))计算出Wh与U中每个特征词的相似度a,最后得出相似度a中的最大值amax=0.6;由于amax>α,阈值α=0.1,执行步骤Step6;
[0145] Step6、判断fx中的Wa是否为自定义网络情感词:本实施例中Wa为“慢”,不属于自定义网络情感词,执行Step7;
[0146] Step7、判断Wd是否为空:本实施例中Wd为“很”,执行步骤Step8;
[0147] Step8、判断fx是否含否定副词:本实施例中不含否定副词如,则与《How Net》词典匹配,并根据公式F(x)=F(a)*F(d)计算出F(1)的评分:F(1)=-1*1.4=-1.4,x=2,执行Step3:2>1,执行步骤Step9;
[0148] Step9、判断是否存在F(x)!=0:本实施例中存在F(1)=-1.4,根据公式计算出综合评分F(O)=-1.4/1=-1.4;最后根据表2得出量化后的评分星级为1星,用户给出的评分星级是4星。因此,输出“APP软件用户评论不一致”。
[0149] 实施例9:如图1所示,APP软件用户评论如表8所示,
[0150] 表8
[0151]
[0152] 所述APP软件用户评论一致性判断方法的具体步骤如下:
[0153] Step1、提取APP软件特征情感词对集F={f1,f2,...,fx}:
[0154] 本实施例中提取的特征情感词对集:F={f1},f1=(null,null,好/a);
[0155] Step2、设置x=1;
[0156] f1=(null,null,好/a)。
[0157] Step3、判断x是否小于或等于u:本实施例中1<=1,执行步骤Step4;
[0158] Step4、判断fx中的Wh是否为空:本实施例Wh为空,执行步骤Step5;
[0159] Step5、判断fx中的Wa是否为自定义网络情感词:本实施例中Wa为“好”,不属于自定义网络情感词,执行Step6;
[0160] Step6、判断Wd是否为空:本实施例中Wd为空,则与《How Net》词典匹配,并根据并根据公式F(x)=F(a)*F(d)*F(n)计算出F(1)的评分:F(1)=1*1*1=1,i=2,执行Step3:2>1,执行步骤Step7;
[0161] Step7、判断是否存在F(x)!=0:本实施例中存在F(1)=1,根据公式计算出综合评分F(O)=1/1=1;最后根据表2得出量化后的评分星级为4星,用户给出的评分星级是4星。因此,输出“APP软件用户评论一致”。
[0162] 实施例10:如图1所示,APP软件用户评论如表9所示,
[0163] 表9
[0164]
[0165] 所述APP软件用户评论一致性判断方法的具体步骤如下:
[0166] Step1、提取APP软件特征情感词对集F={f1,f2,...,fx}:
[0167] 本实施例中提取特征情感词对集:F={f1},f1=(null,(不/d太/d),好/a);
[0168] Step2、设置x=1;
[0169] f1=(null,(不/d太/d),好/a)。
[0170] Step3、判断x是否小于或等于u:本实施例中1<=1,执行步骤Step4;
[0171] Step4、判断fx中的Wh是否为空:本实施例Wh为空,执行步骤Step5;
[0172] Step5、判断fx中的Wa是否为自定义网络情感词:本实施例中Wa为“好”,不属于自定义网络情感词,执行Step6;
[0173] Step6、判断Wd是否为空:本实施例中Wd为“不太”,执行Step7;
[0174] Step7、判断fx是否含否定副词:本实施例中含否定副词“不”,执行Step8;
[0175] Step8、判断fx是否含程度副词:本实施例中含有程度副词“太”,执行Step9;
[0176] Step9、判断fx是否属于DNP形式:本实施例不属于DNP形式,则根据公式F(x)=0.6*F(d)*F(a)计算程度副词在否定副词之前的情感倾向程度得分F(1):F(1)=0.6*1.4*1=0.84,x=2,执行Step3:2>1,执行步骤Step10;
[0177] Step10、判断是否存在F(x)!=0:本实施例中存在F(1)=0.84,根据公式计算出综合评分F(O)=0.84/1=0.84;最后根据表2得出量化后的评分星级为4星,用户给出的评分星级是5星。因此,输出“APP软件用户评论不一致”。
[0178] 实施例11:如图1所示,APP软件用户评论如表10所示,
[0179] 表10
[0180]
[0181] 所述APP软件用户评论一致性判断方法的具体步骤如下:
[0182] Step1、提取APP软件特征情感词对集F={f1,f2,...,fx}:
[0183] 本实施例中提取特征情感词对集:F={f1},f1=(null,(有点/d不/d),好/a);
[0184] Step2、设置x=1;
[0185] f1=(null,(有点/d不/d),好/a)。
[0186] Step3、判断x是否小于或等于u:本实施例中1<=1,执行步骤Step4;
[0187] Step4、判断fx中的Wh是否为空:本实施例Wh为空,执行步骤Step5;
[0188] Step5、判断fx中的Wa是否为自定义网络情感词:本实施例中Wa为“好”,不属于自定义网络情感词,执行Step6;
[0189] Step6、判断Wd是否为空:本实施例中Wd为“有点不”,执行Step7;
[0190] Step7、判断fx是否含否定副词:本实施例中含否定副词“不”,执行Step8;
[0191] Step8、判断fx是否含程度副词:本实施例中含有程度副词“有点”,执行Step9;
[0192] Step9、判断fx是否属于DNP形式:本实施例属于DNP形式,则根据公式F(x)=-0.5*F(d)*F(a)计算程度副词在否定副词之前的情感倾向程度得分F(1):F(1)=(-0.5)*0.8*1=-0.4,x=2,执行Step3:2>1,执行步骤Step10;
[0193] Step10、判断是否存在F(x)!=0:本实施例中存在F(x)=-0.4,根据公式计算出综合评分F(O)=-0.4/1=-0.4;最后根据表2得出量化后的评分星级为2星,用户给出的评分星级是1星。因此,输出“APP软件用户评论不一致”。
[0194] 实施例12:如图1所示,APP软件用户评论如表11所示,
[0195] 表11
[0196]
[0197] 所述APP软件用户评论一致性判断方法的具体步骤如下:
[0198] Step1、提取APP软件特征情感词对集F={f1,f2,...,fx}:
[0199] 本实施例中提取特征情感词对集:F={f1},f1=(null,不/d,好/a);
[0200] Step2、设置x=1;
[0201] f1=(null,不/d,好/a)。
[0202] Step3、判断x是否小于或等于u:本实施例中1<=1,执行步骤Step4;
[0203] Step4、判断fx中的Wh是否为空:本实施例Wh为空,执行步骤Step5;
[0204] Step5、判断fx中的Wa是否为自定义网络情感词:本实施例中Wa为“好”,不属于自定义网络情感词,执行Step6;
[0205] Step6、判断Wd是否为空:本实施例中Wd为“不”,执行Step7;
[0206] Step7、判断fx是否含否定副词:本实施例中含否定副词“不”,执行Step8;
[0207] Step8、判断fx是否含程度副词:本实施例中不含程度副词,则与《How Net》词典匹配,并根据公式F(x)=-0.5*F(a)计算出F(1)的评分:F(1)=(-0.5)*1=-0.5,x=2,执行Step3:2>1,执行步骤Step9;
[0208] Step9、判断是否存在F(x)!=0:本实施例中存在F(1)=-0.5,根据公式计算出综合评分F(O)=-0.5/1=-0.5;最后根据表2得出量化后的评分星级为2星,用户给出的评分星级是4星。因此,输出“APP软件用户评论不一致”。
[0209] 上面结合附图对本发明的具体实施方式作了详细说明,但是本发明并不限于上述实施方式,在本领域普通技术人员所具备的知识范围内,还可以在不脱离本发明宗旨的前提下做出各种变化。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈