专利汇可以提供一种情感分析系统及方法专利检索,专利查询,专利分析的服务。并且本 发明 公开了一种 情感分析 系统及方法。该方法包括:读取需要进行情感分析的文本数据文件,对文本数据文件进行预处理,文本 情感计算 分析,情感分析结果输出。本发明能够对给定的文本文件数据集合进行文本情感分类操作,并直接对 指定 文档生成指定类型的中立、 正面 、负面等三种情感标签,且支持中文及英文两种语言的文档。,下面是一种情感分析系统及方法专利的具体信息内容。
1.一种情感分析方法,其特征在于,包括以下步骤:
S1:文本数据输入:读取需要进行情感分析的文本数据文件;
S2:文本数据预处理,包括以下子步骤:
S21:如果文本数据是中文文档则对文本进行分词处理后进入步骤S22;如果文本是英文文档则直接进入步骤S22;
S22:去除停用词;
S3:文本情感计算分析;
步骤S3包括以下子步骤:
S31:句子表达,包括以下子步骤:
S311:将词进行嵌入,转成嵌入d维的词向量;
S312:使用宽度为1,2,3三种卷积核来挖掘句子中一元、二元和三元的特征;
S313:将线性层输出到均值池化层,将其转为长度固定的向量;
S314:增加一个tanh激活函数来引入非线性,然后整合三个卷积的结果,取平均值后输出;
S32:文本表达:GatedNN将最后一个隐藏层的输出向量作为用于情感分类的特征表达,Gated RNN计算方式如下:
it=sigmoid(Wi⋅[ht−1;st]+bi)
ft=sigmoid(Wf⋅[ht−1;st]+bf)
gt=tanh(Wr⋅[ht−1;st]+br)
ht=tanh(it⊙[ht−1;st]+bi);
S33:情感分类;
S4:情感分析结果输出。
2.根据权利要求1所述的一种情感分析方法,其特征在于,步骤S2所述文本数据预处理采用word2vector向量方式进行词嵌入。
3.根据权利要求1所述的一种情感分析方法,其特征在于,步骤S2所述文本数据预处理采用bert向量方式进行词嵌入。
4.根据权利要求1所述的一种情感分析方法,其特征在于,步骤S3所述文本情感计算分析采用Conv-GRNN算法。
5.根据权利要求1所述的一种情感分析方法,其特征在于,步骤S3所述文本情感计算分析采用LSTM-GRNN算法。
6.根据权利要求1所述的一种情感分析方法,其特征在于,步骤S311所述d=200。
7.根据权利要求1所述的一种情感分析方法,其特征在于,步骤S32还包括使用GatedNN的均值整合历史信息。
8.根据权利要求1所述的一种情感分析方法,其特征在于,步骤S33所述情感分类具体方式为:
S331:人工为每一个参加训练的文本样本标注“正面”、“中立”或“负面”的情感标签;
S332:将已经标注了情感标签的样本投入训练,在迭代一定轮次直到F1分类精度值达到80%,就停止训练;
S333:用事先准备好的测试样本对步骤S332训练得到的模型进行验证,如果在测试样本上F1分类精度值也达到80%,则表明训练得到的模型符合要求;
S334:使用步骤S333得到的模型对指定文本数据进行情感分类。
9.一种情感分析系统,其特征在于,包括文本数据输入模块、文本数据预处理模块、文本情感算法模块和情感分析结果输出模块;
文本数据输入模块用于读取需要进行情感分析的文本数据文件;
文本数据预处理模块用于对加载的文本数据进行预处理;
文本情感算法模块用于计算并判断文本数据的情感类别;
情感分析结果输出模块用于情感分析结果输出。
10.根据权利要求9所述的一种情感分析系统,其特征在于,所述文本数据预处理模块包括word2vector处理模块。
11.根据权利要求9所述的一种情感分析系统,其特征在于,所述文本数据预处理模块包括Bert处理模块。
12.根据权利要求9所述的一种情感分析系统,其特征在于,所述文本情感算法模块包括Conv-GRNN算法模块。
13.根据权利要求9所述的一种情感分析系统,其特征在于,所述文本情感算法模块包括LSTM-GRNN算法模块。
14.根据权利要求9所述的一种情感分析系统,其特征在于,所述情感分析结果为EXCEL格式。
15.根据权利要求11所述的一种情感分析系统,其特征在于,还包括一个由DOCKER容器技术搭建的web服务系统;通过在DOCKER容器级别的WEB服务层,以HTTP形式提供基于Restful风格的WEB服务。
16.根据权利要求9-15任一所述的一种情感分析系统,其特征在于,还包括出错处理模块,出错处理模块用于显示出错信息,并在出现文本数据集合过大,造成内存溢出时,系统内部数据全部回滚到出错前状态。
17.根据权利要求16所述的一种情感分析系统,其特征在于,所述出错信息包括出错时间、出错等级、出错原因和出错地点。
标题 | 发布/更新时间 | 阅读量 |
---|---|---|
一种代言人商业价值评估方法、存储介质和装置 | 2020-05-08 | 487 |
一种基于文档向量的电影评论情感分析方法 | 2020-05-11 | 457 |
一种面向电网电磁环境的网络舆情及风险信息监测系统、电子设备 | 2020-05-12 | 696 |
文本的情感识别方法、装置、服务器以及存储介质 | 2020-05-12 | 81 |
评价数据处理方法、装置、介质和计算机设备 | 2020-05-11 | 780 |
一种用电客户情感指数的量化评估方法 | 2020-05-08 | 160 |
商品推荐方法、装置、计算机设备和存储介质 | 2020-05-08 | 405 |
一种虚拟物品的显示方法、装置、计算机设备和存储介质 | 2020-05-12 | 856 |
语音合成方法、装置、计算机设备及计算机可读存储介质 | 2020-05-08 | 755 |
一种基于神经网络的智能窗户调节方法及装置 | 2020-05-11 | 888 |
高效检索全球专利专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。
我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。
专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。