首页 / 技术领域 / 文本挖掘 / 专利数据
序号 专利名 申请号 申请日 公开(公告)号 公开(公告)日 发明人
1 文本挖掘方法、文本挖掘程序及文本挖掘装置 CN201780043375.8 2017-06-06 CN109478191A 2019-03-15 秋田正史; 中村康则; 周景龙
文本分析步骤(S109~S110)中,对从被输入的文本数据中提取出的字词进行阶层式集群分析。在画面生成步骤(S111)中,根据群组数(m)与群组内的最多数据数(n),从文本分析步骤的分析结果求得(m)个集群,生成用于在画面中显示包含(n)个以下的属于集群所的字词的群组的画面数据。在分析结果显示步骤(S112)中,根据所生成的画面数据来显示画面。通过这样,将阶层式集群分析的结果以使用者可直观地理解的方式显示于画面。
2 文本挖掘系统、文本挖掘方法和程序 CN201380021769.5 2013-04-24 CN104246775A 2014-12-24 土田正明; 石川开; 大西贵士; 达尼埃尔·安德拉德
发明涉及一种文本挖掘系统,包括:同义词聚类获取部,配置为从待分析的文本数据中的文本中获取同义词聚类,所述同义词聚类每个都是同义的文本的集合;隐含关系获取部,配置为获取所述同义词聚类之中的隐含关系;以及隐含图生成部,配置为根据所述同义词聚类之中的隐含关系而生成隐含图,所述隐含图包括同义词聚类的顶点和有向边,每个有向边指示从被隐含的同义词聚类到隐含同义词聚类的方向。
3 文本挖掘方法和文本挖掘装置 CN201210335708.3 2012-09-11 CN103678355A 2014-03-26 杨宇航; 夏迎炬; 于浩
发明涉及文本挖掘方法和文本挖掘装置。文本挖掘方法包括:提取文档中的多个关键词;计算代表每个关键词的特定属性的分值;按照多个关键词在文档中的出现顺序对计算出的分值进行排列,以得到代表文档的分值序列;以及利用分值序列进行与文本挖掘相关联的操作。
4 文本挖掘系统、文本挖掘方法和程序 CN201380021769.5 2013-04-24 CN104246775B 2018-04-17 土田正明; 石川开; 大西贵士; 达尼埃尔·安德拉德
发明涉及一种文本挖掘系统,包括:同义词聚类获取部,配置为从待分析的文本数据中的文本中获取同义词聚类,所述同义词聚类每个都是同义的文本的集合;隐含关系获取部,配置为获取所述同义词聚类之中的隐含关系;以及隐含图生成部,配置为根据所述同义词聚类之中的隐含关系而生成隐含图,所述隐含图包括同义词聚类的顶点和有向边,每个有向边指示从被隐含的同义词聚类到隐含同义词聚类的方向。
5 文本挖掘方法和文本挖掘装置 CN201210335708.3 2012-09-11 CN103678355B 2017-03-01 杨宇航; 夏迎炬; 于浩
发明涉及文本挖掘方法和文本挖掘装置。文本挖掘方法包括:提取文档中的多个关键词;计算代表每个关键词的特定属性的分值;按照多个关键词在文档中的出现顺序对计算出的分值进行排列,以得到代表文档的分值序列;以及利用分值序列进行与文本挖掘相关联的操作。
6 文本挖掘方法、文本挖掘存储介质及文本挖掘装置 CN201910164187.1 2019-03-05 CN110309260A 2019-10-08 周景龙
发明提供一种文本挖掘方法,包括:从由具有日期的句子构成的文本数据中提取字词的步骤;对提取出的字词按照每个分析期间进行层次性集群分析的步骤;以及将包含层次性集群分析的结果的画面进行显示的步骤。当在包含分析结果的第一画面内输入了用于指定有关注语的指示时,通过沿着时间轴示出基于包含关注语的集群中包含的字词的集群名来显示第二画面,该第二画面示出包含关注语的集群随时间的变化。由此,能够容易地识别层次性集群分析的结果随时间的变化。
7 文本挖掘方法、文本挖掘存储介质及文本挖掘装置 CN201910164187.1 2019-03-05 CN110309260B 2023-07-18 周景龙
发明提供一种文本挖掘方法,包括:从由具有日期的句子构成的文本数据中提取字词的步骤;对提取出的字词按照每个分析期间进行层次性集群分析的步骤;以及将包含层次性集群分析的结果的画面进行显示的步骤。当在包含分析结果的第一画面内输入了用于指定有关注语的指示时,通过沿着时间轴示出基于包含关注语的集群中包含的字词的集群名来显示第二画面,该第二画面示出包含关注语的集群随时间的变化。由此,能够容易地识别层次性集群分析的结果随时间的变化。
8 文本挖掘方法、文本挖掘程序以及文本挖掘装置 CN201910096738.5 2019-01-31 CN110309290B 2023-06-06 柿木未希
文本挖掘方法包括:从文本数据中提取字词的步骤;针对提取的字词生成共现矩阵的步骤;基于生成的共现矩阵生成共现网络的步骤;以及显示包含生成的共现网络的画面的步骤。当在包含以指定的整体文本数据为基础的第一共现网络的第一画面中输入指定关注语的指示时,从限定文本数据中提取字词,该限定文本数据由指定的文本数据中的包含关注语的部分构成,针对提取的字词使用限定文本数据生成第二共现矩阵,基于第二共现矩阵生成第二共现网络,显示包含第二共现网络的第二画面。
9 文本挖掘方法、文本挖掘程序以及文本挖掘装置 CN201910096738.5 2019-01-31 CN110309290A 2019-10-08 柿木未希
文本挖掘方法包括:从文本数据中提取字词的步骤;针对提取的字词生成共现矩阵的步骤;基于生成的共现矩阵生成共现网络的步骤;以及显示包含生成的共现网络的画面的步骤。当在包含以指定的整体文本数据为基础的第一共现网络的第一画面中输入指定关注语的指示时,从限定文本数据中提取字词,该限定文本数据由指定的文本数据中的包含关注语的部分构成,针对提取的字词使用限定文本数据生成第二共现矩阵,基于第二共现矩阵生成第二共现网络,显示包含第二共现网络的第二画面。
10 文本挖掘设备、文本挖掘系统、文本挖掘方法和记录介质 CN201480004597.5 2014-01-10 CN104919458A 2015-09-16 土田正明; 石川开; 大西贵士
一种文本挖掘设备(100)包括:分析单元(120),其从包括文本和具有属性名称和属性值并且与该文本相关联的一个或多个属性的数据获取属性作为分析观点,并且通过使用相应的分析观点分析该数据来从相应的分析观点获取分析结果;向量生成单元(130),其生成相应的分析观点的结果向量;相似度获取单元(140),其获取多个相应的分析观点的结果向量之间的向量相似度;以及推荐单元(150),其基于向量相似度提取分析观点的组合并将其呈现作为推荐候选。
11 文本挖掘的方法和装置 CN201510569585.3 2015-09-09 CN106528519B 2019-04-30 张碧川; 黄耀海; 清水涉
发明提供了一种文本挖掘的方法和装置。该方法包括文本串接收步骤,用于接收输入文本串;状态对提取步骤,用于根据输入文本串提取状态对,该状态对包括第一状态和第二状态,第一状态包含第一满意度值和第一描述单元,第一满意度值为满意或不满意,第一描述单元包含第一名词和第一描述短语,其中,第一描述短语所描述的对象是第一名词,第一描述短语包含第一形容词或第一动词,且第二状态与第一状态相反;动作文本生成步骤,用于生成动作文本,动作文本描述了一个动作,该动作对应第一状态到第二状态的状态转移,动作文本包含第三动词和第三动词的宾语。利用本发明,能准确地生成动作文本并对输入文本串准确分类。
12 文本挖掘的方法和装置 CN201510569585.3 2015-09-09 CN106528519A 2017-03-22 张碧川; 黄耀海; 清水涉
发明提供了一种文本挖掘的方法和装置。该方法包括文本串接收步骤,用于接收输入文本串;状态对提取步骤,用于根据输入文本串提取状态对,该状态对包括第一状态和第二状态,第一状态包含第一满意度值和第一描述单元,第一满意度值为满意或不满意,第一描述单元包含第一名词和第一描述短语,其中,第一描述短语所描述的对象是第一名词,第一描述短语包含第一形容词或第一动词,且第二状态与第一状态相反;动作文本生成步骤,用于生成动作文本,动作文本描述了一个动作,该动作对应第一状态到第二状态的状态转移,动作文本包含第三动词和第三动词的宾语。利用本发明,能准确地生成动作文本并对输入文本串准确分类。
13 一种文本挖掘方法 CN201610161977.0 2016-03-22 CN105808765A 2016-07-27 贺超英
发明公开了一种文本挖掘方法,采用字符串处理电路对由数据接收电路接收的字符数据进行处理,数据接收电路、存储器、远程通信模和显示模块均与字符串处理电路相连;所述的字符串处理电路包括字符串识别电路、累加器和计时器;显示模块包括第一显示屏和第二显示屏,第一显示屏具有基于单色LED灯背光模块,第二显示屏具有基于三色灯的背光模块;显示模块用于对字符串处理电路输出的数据进行显示。该用于文本挖掘的方法功能丰富,易于实施。
14 文本挖掘装置和其方法 CN200580008562.X 2005-03-17 CN1934570B 2012-05-16 坂尾要祐; 佐藤研治; 赤峰享
语言解析单元(21)解析从文本DB(11)读入的各个文本,并作为分析结果而生成句子结构。相似结构生成调整单元(25)生成根据来自输入装置的输入而对句子结构间每种类型的差异指定是否判定为同一结构的指定项。相似结构判定调整单元(26)生成根据来自输入装置(6)的输入而对属性值的每种类型指定是否忽略属性值间差异的指定项。相似结构生成单元(22)根据来自相似结构生成调整单元(25)的指定项,生成构成由语言解析单元(21)获得的句子结构的部分结构的相似结构,并将生成的各个相似结构设为各个生成源的部分结构的等价类。频繁相似模式检测单元(24)根据由相似结构判定调整单元(26)给出的指定项而忽略属性值,从来自相似结构生成单元(22)的等价类的集合中检测频繁模式并输出给输出装置(3)。
15 一种文本数据挖掘方法 CN200580049341.7 2005-06-22 CN101151843B 2010-05-12 李进; 李小进; 邓朝明; 唐文彬; 郭梅彭; 向梅
发明公开了一种文本数据挖掘方法。包括步骤:读取包含有至少一个模板变量规则的预制模板文件;根据所述模板变量规则,将所述模板文件编译为由正则表达式构成的模板对象;根据所述模板对象,扫描待挖掘的文本数据,对其进行数据匹配;根据所述正则表达式,将所述文本数据中匹配的原始信息顺序提取出来;以及根据所述模板变量规则,将所述提取出来的原始信息解析为指定数据名与数据类型的数据值。按照本发明,对不同格式的文本数据只需通过修改模板文件就可以对其进行分析处理,而不需要依靠开发程序代码或使用昂贵的商业化数据挖掘工具,从而降低了电信网管系统的复杂性和成本。
16 文本挖掘系统及工具 CN201510497553.7 2015-08-13 CN106055545A 2016-10-26 高拉夫·翟恩; 狄平德·迪因格拉; 祖宾·道拉蒂; 巴拉特·阿帕德拉斯塔
发明提供了一种用于从多个输入数据集中提取相关文本的文本挖掘系统。文本挖掘系统包括输入接口,该输入接口模块配置成使一个或多个用户能够选择用于多个输入数据集的多个源。文本挖掘系统还包括文本分析模块,该文本分析模块配置成接收多个输入数据集并通过分析多个输入数据集而生成输出数据集。文本分析模块包括数据处理模块,该数据处理模块配置成将多个输入数据集转换成分析文本集。文本分析模块还包括探索性分析模块,该探索性分析模块配置成确定分析文本集中的多个相关性。文本分析模块还包括主题建模模块和报告模块,主题建模模块配置成识别在分析文本集中反复出现的多个主题,报告模块配置成生成用于文本分析模块的多个报告。文本挖掘系统还包括存储电路,该存储电路设置成储存多个输入数据集、分析文本集以及输出数据集。
17 一种文本数据挖掘方法 CN200580049341.7 2005-06-22 CN101151843A 2008-03-26 李进; 李小进; 邓朝明; 唐文彬; 郭梅彭; 向梅
发明公开了一种文本数据挖掘方法。包括步骤:读取包含有至少一个模板变量规则的预制模板文件;根据所述模板变量规则,将所述模板文件编译为由正则表达式构成的模板对象;根据所述模板对象,扫描待挖掘的文本数据,对其进行数据匹配;根据所述正则表达式,将所述文本数据中匹配的原始信息顺序提取出来;以及根据所述模板变量规则,将所述提取出来的原始信息解析为指定数据名与数据类型的数据值。按照本发明,对不同格式的文本数据只需通过修改模板文件就可以对其进行分析处理,而不需要依靠开发程序代码或使用昂贵的商业化数据挖掘工具,从而降低了电信网管系统的复杂性和成本。
18 文本挖掘设备、文本挖掘方法和记录介质 CN201480004597.5 2014-01-10 CN104919458B 2018-12-14 土田正明; 石川开; 大西贵士
一种文本挖掘设备包括:分析单元,其从包括文本和具有属性名称和属性值并且与该文本相关联的一个或多个属性的数据获取属性作为分析观点、使用相应的分析观点分析该数据来从每个分析观点获得分析结果并且生成相应的分析观点的结果向量;相似度获取单元,其获取多个分析观点的结果向量之间的向量相似度;以及推荐单元,其基于向量相似度提取并输出分析观点的组合作为推荐候选。
19 文本挖掘方法、记录介质及文本挖掘装置 CN201780043375.8 2017-06-06 CN109478191B 2022-04-08 秋田正史; 中村康则; 周景龙
文本分析步骤(S109~S110)中,对从被输入的文本数据中提取出的字词进行阶层式集群分析。在画面生成步骤(S111)中,根据群组数(m)与群组内的最多数据数(n),从文本分析步骤的分析结果求得(m)个集群,生成用于在画面中显示包含(n)个以下的属于集群所的字词的群组的画面数据。在分析结果显示步骤(S112)中,根据所生成的画面数据来显示画面。通过这样,将阶层式集群分析的结果以使用者可直观地理解的方式显示于画面。
20 文本挖掘方法、存储介质以及文本挖掘装置 CN202310119160.7 2023-02-01 CN116541518A 2023-08-04 周景龙; 中村康则
发明能够以较少的计算量基于文档中的情感词的适当评价来在多个文档之间比较情感倾向。在本发明的文本挖掘方法中,接受将应比较情感极性的倾向的多个文档指定为对象文档的指示、指定应从对象文档中提取出的特征词的范围的指示、以及指定表示情感极性的强度的情感指数的范围的指示,基于这些指示,在指定范围内从该多个文档中提取特征词,对提取出的特征词中的作为赋予指定范围内的情感指数的情感词而被登记在规定的情感词词典中的特征词,赋予该情感指数。然后,在该多个文档之间可比较地显示所提取出的特征词和所赋予的情感指数。在该显示中,例如对赋予了情感指数的特征词附加与其情感指数对应的背景色。
QQ群二维码
意见反馈