专利汇可以提供一种保留非结构化文本语义的文本可视化方法专利检索,专利查询,专利分析的服务。并且本 发明 提供了一种保留非结构化文本语义的社交媒体文本 可视化 方法,包括如下步骤:步骤S101,对输入本文进行分词、过滤、 词性标注 、获取依赖关系;步骤S102,基于词性标注与词汇间的依赖关系,构建句法二叉树,计算每条文本的 情感极性 ,将文本集划分为正、负两类;步骤S103,分别对正负两类文本,基于词频与词汇在每条文本中的共现关系,生成词汇序列模式,保留语义;步骤S104,基于正负文本集所占权重,分配可视空间,设计可视字体、色彩;步骤S105,采用布局 算法 ,展现序列模式内、序列模式间的语义关系;步骤S106,引入交互设计,使用户可关注局部细节。采用本发明的方法,实现对社交媒体文本的可视化,清晰呈现文本的情感取向、观点语义与舆论支持度,有效呈现文本信息,有助于 文本分析 。,下面是一种保留非结构化文本语义的文本可视化方法专利的具体信息内容。
1.一种保留非结构化文本语义的社交媒体文本可视化方法,其特征在于包括如下步骤:
步骤S101,对输入本文进行分词、过滤、词性标注和词汇间依赖关系的获取;
步骤S102,基于词性标注与词汇间的依赖关系,构建句法二叉树,计算每条文本的情感极性,将文本集划分为正、负两类;
步骤S103,分别对正负两类文本,基于词频和词汇在每条文本中的共现关系,生成词汇序列模式,保留语义;
步骤S104,基于正负文本集所占权重,分配可视空间,设计可视字体、色彩;
步骤S105,采用布局算法,展现序列模式内、序列模式间的语义关系;
步骤S106,引入交互设计,使用户可关注局部细节;
2.根据权利要求1所述的一种保留非结构化文本语义的社交媒体文本可视化方法,其特征在于所述步骤S102中计算单条文本情感极性的具体方法为:首先利用句法分析器进行句法分析,得到词语之间的依赖关系和单个词汇的情感极性,再基于所得依存关系,为句子构建句法二叉树结构,利用词语间的依赖关系和规则的方法,将句子情感判断转化为基于树的符号计算。
3.根据权利要求1所述的一种保留非结构化文本语义的社交媒体文本可视化方法,其特征在于所述步骤S102中构建句法二叉树的具体方法为:第一步,创建空栈,读入句首词汇;第二步,若下一个词汇不存在,跳转至第五步,否则,读入下一个词汇;第三步,读取栈顶两个节点的依存关系,若存在依存关系,则生成父节点,并依据情感计算规则计算父节点的词性,进入下一步;若不存在依存关系,则跳转到第二步;第四步,若此时栈内多余两个节点,则跳转至第三步,否则,跳转至第二步;第五步,输出栈内节点的情感极性,即整条文本的情感极性。
4.根据权利要求1所述的一种保留非结构化文本语义的社交媒体文本可视化方法,其特征在于所述步骤S103中生成词汇序列模式的具体方法为:初始状态下,序列模式生成树的唯一序列是给定的,每次运行后,最高频的序列模式都会出栈,寻找比它多一个单词的子序列模式,新的序列模式作为原模式树原模式结点的左孩子,原先的模式序列变成自己的右孩子,原先模式序列的频度被分为两部分,即包含新的序列模式的部分,和不包含新的序列模式的部分,如此循环,直到剩余所需可视词汇数变为0。
5.根据权利要求1所述的一种保留非结构化文本语义的社交媒体文本可视化方法,其特征在于所述步骤S104中分配可视空间、设计可视界面的具体方法为:正负极性的两类文本中,权重较大的位于上方,权重小的位于下方,并占据与权重比相应的面积比例,正负文本集采用不同色彩的边连接节点,并使用字体大小和透明度来二次编码出现频率。
6.根据权利要求1所述的一种保留非结构化文本语义的社交媒体文本可视化方法,其特征在于所述步骤S105中布局算法的具体方法为:序列模式的水平布局先后与在序列模式中的先后顺序一致,若两个模式序列同属于一个模式序列的子序列,则布局时垂直排列。
7.根据权利要求1所述的一种保留非结构化文本语义的社交媒体文本可视化方法,其特征在于所述步骤S106交互设计的具体方法为,模型初始状态下展示所有序列模式的复合图,当用户将鼠标聚焦于某一词语时,与它同属于一个序列模式的词汇会被高亮,其余词汇会被加上阴影,借此来清晰展现某一个序列模式的语义,同时,模型会通过一个浮层来显示包含该序列模式且权重最高的文本,以披露更多细节信息。
标题 | 发布/更新时间 | 阅读量 |
---|---|---|
一种自然语言处理方法和装置 | 2020-05-12 | 309 |
文本的情感分析方法、装置、电子设备及可读存储介质 | 2020-05-12 | 974 |
一种微博文本分类系统 | 2020-05-13 | 722 |
一种用于语音情感识别的具有多输入多融合策略的双BiLSTM结构 | 2020-05-14 | 942 |
句子的情感极性分析方法、装置及存储介质 | 2020-05-16 | 85 |
酒店评分方法、酒店推荐方法、电子装置和存储介质 | 2020-05-08 | 810 |
一种基于深度学习的物流智能客服系统的用户情感分析系统及方法 | 2020-05-08 | 795 |
针对虚拟人的性格训练系统及其方法 | 2020-05-08 | 806 |
一种基于社交媒体大数据的公司形象提升系统架构 | 2020-05-11 | 451 |
一种基于语义的大数据分析智能服务系统 | 2020-05-11 | 286 |
高效检索全球专利专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。
我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。
专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。