专利汇可以提供基于对比模式的随机森林分类方法和分类器专利检索,专利查询,专利分析的服务。并且本 发明 公开了基于对比模式的 随机森林 分类方法和分类器。其中,所述方法包括:由构成随机森林的每个弱分类器对输入数据进行分类判别,将弱分类器的输出进行编码,进而将每一弱分类器的输出量化为一个符号;所有所述弱分类器输出的符号构成一个符号集合,将该集合作为学习到的判别规则集合的输入,并根据当前符号集合以及判别规则集合中的所有判别规则,给出每一个类别的判别分数;选择判别分数最大的类别作为所述输入数据的最终判定类别。本发明很好的提高了原有随机森林的分类器的精确度。,下面是基于对比模式的随机森林分类方法和分类器专利的具体信息内容。
1.一种基于对比模式的随机森林分类方法,其特征在于,所述方法基于随机森林分类器,所述随机森林分类器包括多个弱分类器;该方法包括如下步骤:
量化处理步骤,由构成随机森林的每个弱分类器对输入数据进行分类判别,将弱分类器的输出进行编码,进而将每一弱分类器的输出量化为一个符号;
判别分数计算步骤,将所有所述弱分类器输出的符号构成符号集合,将该集合作为学习到的判别规则集合的输入,并根据当前符号集合以及判别规则集合中的每一个判别规则,给出每一个类别的判别分数;
类别判定步骤,选择判别分数最大的类别作为所述输入数据的最终判定类别。
2.根据权利要求1所述的分类方法,其特征在于,
所述判别分数计算步骤中,所述判别规则集合通过分析所述多个弱分类器输出的符号之间的相关性和规律性,基于数据挖掘方法得到的在不同数据类别之间具有判别能力的判别模式。
3.根据权利要求2所述的分类方法,其特征在于,所述判别分数计算步骤中,所述每一个类别的判别分数通过如下步骤获取:
步骤A,给定N(N>1)个类别的训练数据,对于每个类别i,将第i类的训练数据作为正例,除i以外的其他所有类别的训练数据作为反例;
步骤B,将所述正例和所述反例的数据送到所述随机森林分类器进行分类,将每个数据的所有弱分类器的输出进行量化处理转化为符号集合;
步骤C,利用对比模式挖掘方法从所述符号集合中挖掘出能够显著区分正例和反例数据的模式;所述模式为符号集合p;
步骤D,将每个判别模式p转化为对应的判别法则P,确定该判别法则对于类别i的判别分数。
4.根据权利要求3所述的分类方法,其特征在于,
所述步骤B中,所述正例数据对应的符号集合集表示为PS={ps1,ps2,...,psJ},反例数据对应的符号集合集表示为NS={ns1,ns2,...,nsK},其中J,K为正反例的个数,且J>1,K>1;并且,所述步骤C中,所述数值集合p满足以下条件:
其中,θsp和θgr(θgr>1)分别为预先指定的阈值;
所述步骤D中,数据x关于类别i的判别分数依据下式计算:
其中,Φi是第i类所有挖掘到的判别法则集合,Zi是第i类数据的正则项,其中Xs是数据x的编码符号集合。
5.一种基于对比模式的随机森林分类器,所述随机森林分类器包括多个弱分类器,其特征在于,还包括:
量化处理模块,用于由构成随机森林的每个弱分类器对输入数据进行分类判别,将弱分类器的输出进行编码,进而将每一弱分类器的输出量化为一个符号;
判别分数计算模块,用于将所有所述弱分类器输出的符号构成符号集合,将该集合作为学习到的判别规则集合的输入,并根据当前符号集合中的数值以及判别规则集合中的每一个判别规则,给出每一个类别的判别分数;
类别判定模块,用于选择判别分数最大的类别作为所述输入数据的最终判定类别。
6.根据权利要求5所述的分类器,其特征在于,
所述判别分数计算模块中,所述判别规则集合通过分析所述多个弱分类器输出的的符号之间的相关性和规律性,基于数据挖掘方法得到的在不同数据类别之间具有判别能力的判别模式。
7.根据权利要求6所述的分类器,其特征在于,所述判别分数计算模块包括:
模块A,用于给定N(N>1)个类别的训练数据,对于每个类别i,将第i类的训练数据作为正例,除i以外的其他所有类别的训练数据作为反例;
模块B,用于将所述正例和所述反例的数据送到所述随机森林分类器进行分类,将每个数据的所有弱分类器的输出进行量化处理转化为符号集合;
模块C,用于利用对比模式挖掘方法从所述符号集合中挖掘出能够显著区分正例和反例数据的模式;所述模式为符号集合p;
模块D,用于将每个判别模式p转化为对应的判别法则P,确定该判别法则对于类别i的判别分数。
8.根据权利要求7所述的分类方法,其特征在于,
所述模块B中,所述正例数据对应的符号集合集表示为PS={ps1,ps2,...,psJ},反例数据对应的符号集合集表示为NS={ns1,ns2,...,nsK},其中J,K为正反例的个数,且J>1,K>1;并且,所述模块C中,所述数值集合p满足以下条件:
其中,θsp和θgr(θgr>1)分别为预先指定的阈值;
所述模块D中,数据x关于类别i的判别分数依据下式计算:
其中,Φi是第i类所有挖掘到的判别法则集合,Zi是第i类数据的正则项,其中Xs是数据x的编码符号集合。
本发明涉及模式识别和计算机视觉领域,尤其涉及一种基于对比模式的随机森林分类方法和分类器。
标题 | 发布/更新时间 | 阅读量 |
---|---|---|
一种以太坊网络行为分析方法及相应存储介质与电子装置 | 2020-05-08 | 818 |
一种基于数据挖掘的结构安全评估及预报方法 | 2020-05-12 | 427 |
一种基于投票集成学习的心电数据智能分类方法 | 2020-05-12 | 330 |
一种吹塑成形工艺参数在线调控方法 | 2020-05-12 | 739 |
一种智能配变终端及其应用系统、安全态势评估方法 | 2020-05-08 | 143 |
基于上下文检测的智能手机隐式身份认证方法 | 2020-05-11 | 663 |
围术期风险评估和临床决策智能辅助系统 | 2020-05-12 | 834 |
告警记录生成方法、装置、告警设备及存储介质 | 2020-05-11 | 717 |
一种基于机载激光雷达点云数据的高精DEM构建方法 | 2020-05-08 | 822 |
金融主客体动态信用评估方法及装置 | 2020-05-08 | 737 |
高效检索全球专利专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。
我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。
专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。