首页 / 技术领域 / 聚类算法 / 专利数据
序号 专利名 申请号 申请日 公开(公告)号 公开(公告)日 发明人
1 进化聚类算法 CN200980153966.6 2009-12-23 CN102272764A 2011-12-07 N.贝赫拉; S.辛哈; R.古普塔; A.格安斯; N.迪米特罗瓦
该方法涉及从基因库选择候选基因集合。所述方法包括,接受基因数据集;使用聚类算法,将基因数据集安排成具有类似特性的簇集合;和将所述簇集合输入遗传算法,以从簇集合选择候选基因集合。所述方法因而涉及通过聚类计算进行选择和通过进化计算进行选择之间的杂种。该杂种也称作进化聚类算法(ECA)。
2 密度峰值聚类算法的聚类策略优化 CN202011462448.7 2020-12-14 CN113822310A 2021-12-21 纪耀立; 姜诚; 杨海波
发明提出了一种方法,对于密度峰值聚类算法的聚类策略进行优化,主要解决密度峰值聚类算法在确定聚类中心后,剩余点分配过程中,因某个点分配错误而导致的“多米诺骨牌”效应。利用k‑dist值剔除噪声点,使簇与簇之间更加独立;运用广度优先搜索遍历算法对簇进行遍历,实现样本点的聚类;最后将剩余点分批次的分配给离其最近的点所在的类。这种聚类策略减少了噪声点对聚类结果的影响,避免了聚类过程中因为一个点分配错误而导致的连反应,显著提高了聚类效果。
3 密度峰值聚类算法的聚类策略优化 CN202110762011.3 2021-07-06 CN113378986A 2021-09-10 纪耀立; 万静; 姜诚
发明提出了一种方法,对于密度峰值聚类算法的聚类策略进行优化,主要解决密度峰值聚类算法在确定聚类中心后,剩余点分配过程中,因某个点分配错误而导致的“多米诺骨牌”效应。利用k‑dist值剔除噪声点,使簇与簇之间更加独立;运用广度优先搜索遍历算法对簇进行遍历,实现样本点的聚类;最后将剩余点分批次的分配给离其最近的点所在的类。这种聚类策略减少了噪声点对聚类结果的影响,避免了聚类过程中因为一个点分配错误而导致的连反应,显著提高了聚类效果。
4 一种自动识别聚类数的层次聚类算法 CN202211039756.8 2022-08-29 CN115293290A 2022-11-04 龙建武; 王强
发明提供一种自动识别聚类数的层次聚类算法,包括以下步骤:利用自然邻居搜索停止时所有数据点的反向邻居数最大值μ以及数据点μ近邻的欧式距离之和计算数据点的密度,设计一种通过手动输入参数控制噪声比例的动态噪声识别器来识别噪点进行去噪,获得去噪后的数据集;利用距离越近的点越容易划分到同一个聚类中这一思想,设计一种基于k近邻有向边迭代图合并过程划分聚类的方法进行聚类,记录聚类数和迭代次数的关系,利用迭代次数最大值判定最佳聚类数,得到去噪后数据集的最佳聚类结果;对噪点数据划分聚类,得到最终聚类结果。本申请通过对去噪后数据集构造k近邻有向图,迭代图合并过程进行聚类,利用迭代次数最大值判断数据集的最佳聚类数。
5 动态数据聚类算法 CN201010290571.5 2010-09-25 CN101957850A 2011-01-26 张仲非; 金永波; 杨名; 祁仲昂; 王跃
动态数据聚类算法,属于信息数据处理的技术领域。包括如下步骤:选择一个关系网络,对关系网络内的动态关系数据进行预处理;对一定连续时间关系网络内的动态关系数据,以相同的时间间隔采集离散数据,表示为无向图的网络形式,然后将无向图以关系矩阵的形式表示;对矩阵进行分解,建立基于矩阵分解的全局代价函数,采用循环迭代加载更新代价函数修正聚类结果。本发明提出将聚类算法应用于动态关系数据,考虑关系数据时序上的关联性,利用历史数据信息来修正现时数据的分析结果,根据结点在不同时刻聚类结果的变化,跟踪数据个体的聚类结果。在不同的网络数据中,揭示结点不同的行为特性,对测试结点未来发展趋势可根据历史数据信息作有效估计。
6 基于层次聚类的改进K均值聚类算法 CN201410350480.4 2014-07-22 CN104102726A 2014-10-15 刘晓波; 张明明; 袁光前; 陈鹏
发明公开了一种基于层次聚类的改进K均值聚类算法,其步骤为:计算n个对象两两间的距离;构造n个单成员聚类;根据数据得出层次聚类;当数据分为K类时,计算出每一类的聚类中心;以求出的聚类中心作为K均值的初始聚类中心,K值作为K均值聚类的个数,进行K均值聚类得到聚类结果。本发明通过比较聚类结果与改进的K均值聚类结果两者的组内方差与组间方差表明改进的K均值聚类更为准确合理。将层次聚类和k-均值聚类各自的优点都尽量的发挥出来,避免两个聚类方法自身的不足,最大程度的提高了聚类的质量
7 基于模糊C-均值算法和人工蜂群聚类算法的混合聚类算法 CN201810935647.1 2018-08-16 CN109086831A 2018-12-25 李宏伟; 卫建华; 田智慧; 赫晓慧; 郭恒亮; 王晓蕾; 赵姗
发明涉及人工蜂群算法技术领域,具体涉及基于模糊C-均值算法和人工蜂群聚类算法的混合聚类算法,该算法包括初始化阶段、引领蜂阶段、跟随蜂阶段和侦查蜂阶段,还包括如下步骤:步骤一:跟随蜂阶段结束后,判断当前算法是否是第一次循环;若是,则执行步骤二;若不是,则执行步骤三;步骤二:将当前的最优解作为模糊C-均值聚类算法的初始聚类中心进行优化,若优化后的解的质量高于当前最优解,则用优化后的解代替当前最优解,否则放弃,同时相应蜜源的迭代次数加1,然后进入侦查蜂阶段;步骤三:判断最优解在跟随蜂阶段后是否发生改变;若是,则执行步骤二;若否,则进入侦查蜂阶段。本发明所提供的算法聚类准确率高、收敛速度快、寻优精度高。
8 基于聚类算法的社区划分DTN路由算法 CN202310595510.7 2023-05-25 CN116723471A 2023-09-08 从立钢; 丁慧颖; 解男男; 底晓强; 李锦青; 任维武; 毕琳; 刘旭
基于聚类算法的社区划分DTN路由算法,涉及延迟容忍网络卫星通信领域,本发明利用Circle‑k‑means聚类算法,根据轨迹相似度将卫星节点聚类,并根据卫星节点所在社区卫星轨迹相似度总和,变换社区中心卫星节点,不断迭代聚类过程,直至卫星网络中所有社区都处于稳定状态,开始路由转发消息。中心卫星节点根据消息的目的地址,查询自己当前维护的索引表,决定消息执行社区内转发还是社区间转发。本发明可以大大减少相同的消息在网络中重复转发,以达到提高数据包转发效率,减少端到端传输时延,降低网络开销的目的。
9 基于聚类成员选择的三层加权聚类集成算法 CN202310394403.8 2023-04-13 CN116451100A 2023-07-18 许贺洋; 李娜; 徐森; 花小朋; 皋军; 刘博通; 郭乃瑄; 刘轩琦; 高婷; 孙雯; 徐畅; 陈博炜
发明提供了一种基于聚类成员选择的三层加权聚类集成算法,包括:步骤1、获取数据集,基于K‑means算法进行聚类成员的生成,得到聚类集体;步骤2、基于预设选择规则,对聚类集体中的聚类成员进行选择,生成新的聚类成员集合High;步骤3、对新的聚类成员集合High进行点层、簇层和划分层的三层加权聚类集成,生成聚类结果Π;步骤4、基于预设内部指标和预设外部指标对聚类结果Π进行聚类结果有效性分析,得到分析结果;本发明根据某一评价指标来衡量基聚类的质量,进而去除质量较差的基聚类,然后再进行点、簇及划分的三层加权,进一步提升聚类的准确性。
10 一种基于改进层次聚类算法的变电站聚类方法 CN202011352023.0 2020-11-26 CN112465022A 2021-03-09 司大军; 徐衍会; 李玲芳; 周俊东; 孙鹏; 胡文岳; 游广增; 陈义宣; 陈姝敏; 何烨; 肖友强; 高杉雪
申请提供一种基于改进层次聚类算法的变电站聚类方法,所述方法将每个变电站定义为单个集合,计算所述集合的标准化基尼系数,将所述标准化基尼系数和设定的阈值比较,若所述标准化基尼系数大于所述阈值,则利用包含不公平指标的单链接聚类算法计算集合之间的距离度量,若所述标准化基尼系数小于或等于所述阈值,则利用单链接聚类算法计算集合之间的距离度量,直到所有集合的总个数小于或者等于终止值,算法结束,输出聚类结果。本申请提供了一种基于改进层次聚类算法的变电站聚类方法,通过所述方法对变电站聚类可提高聚类结果的准确度,并且通过设置基尼系数阈值,对每个大类所包含的变电站个数具有引导作用,提高结果的准确度。
11 一种基于改进谱聚类算法的文本聚类方法 CN202011464923.4 2020-12-14 CN112464638B 2022-12-30 张校源; 马祥祥
发明涉及一种基于改进谱聚类算法的文本聚类方法,包括:对待聚类文档集依次进行分词、去停用词以及提取关键词处理;创建文本相似度矩阵、邻接矩阵、度矩阵以及拉普拉斯矩阵;计算拉普拉斯矩阵的特征值和特征向量,得到特征矩阵;采用经典聚类方法对特征矩阵进行聚类,得到对应的聚类结果;若已知类别个数,则结合聚类结果以及提取的关键词,基于TF‑IDF算法提取出类别关键词;若未知类别个数,则依次调整聚类参数,以得到对应的多个调整聚类结果,对多个调整聚类结果进行评估,选取出最优的聚类结果;输出聚类结果及对应的类别关键词。与现有技术相比,本发明针对已知或未知类别数的情况,能够对文本进行聚类,同时能够输出对应于各类别的关键词。
12 基于尔科夫聚类算法的动态聚类方法 CN201910980794.5 2019-10-16 CN112668598A 2021-04-16 张陈欢; 刘惟锦; 张晓林; 李雪; 杨剑锋; 黄益平
发明涉及一种基于尔科夫聚类算法的动态聚类方法,将数据集按照适合改进后的马尔科夫聚类算法的数据规模P进行批量聚类,即每次从数据集选取数据规模为P的数据集进行聚类;使用代表点算法在有新增数据时快速完成聚类更新,对于新增数据和原有数据分别利用代表类簇的代表点进行聚类,并根据聚类结果进行类别合并从而完成聚类更新,从而减少每次参与聚类的数据量,提高聚类的效率。本发明解决了马尔科夫聚类算法对大规模数据聚类精度低、速度缓慢的问题,主要应用于监控视频下类别数量未知的大规模人脸聚类。
13 一种基于改进谱聚类算法的文本聚类方法 CN202011464923.4 2020-12-14 CN112464638A 2021-03-09 张校源; 马祥祥
发明涉及一种基于改进谱聚类算法的文本聚类方法,包括:对待聚类文档集依次进行分词、去停用词以及提取关键词处理;创建文本相似度矩阵、邻接矩阵、度矩阵以及拉普拉斯矩阵;计算拉普拉斯矩阵的特征值和特征向量,得到特征矩阵;采用经典聚类方法对特征矩阵进行聚类,得到对应的聚类结果;若已知类别个数,则结合聚类结果以及提取的关键词,基于TF‑IDF算法提取出类别关键词;若未知类别个数,则依次调整聚类参数,以得到对应的多个调整聚类结果,对多个调整聚类结果进行评估,选取出最优的聚类结果;输出聚类结果及对应的类别关键词。与现有技术相比,本发明针对已知或未知类别数的情况,能够对文本进行聚类,同时能够输出对应于各类别的关键词。
14 一种基于AP聚类算法的广义负荷特性聚类方法 CN201510497352.7 2015-08-13 CN105005708B 2017-10-24 梁军; 褚壮壮; 贠志皓; 张旭; 张永亮; 梁正堂
发明公开了一种基于AP聚类算法的广义负荷特性聚类方法,包括以下步骤:采集根母线节点电与广义负荷数据,计算场均速度、波动速度和波动强度;确定波动强度的最小时间长度和聚类时间间隔;将广义负荷节点功率的全部训练样本数据按聚类时间间隔统一分段,构建聚类特征向量;赋予样本数据偏向参数,基于AP聚类算法,以特征向量为指标进行聚类,确定聚类中心;若样本点的聚类中心满足设定聚类条件,则输出聚类结果,否则返回上一步骤,直至得到准确的聚类结果。本发明有效解决了传统建模方法无法描述节点特性随机变化的问题。
15 一种基于谱聚类算法的选择性聚类集成方法 CN201410096258.6 2014-03-14 CN103995821B 2017-05-10 徐森; 李先锋; 曹瑞; 花小朋; 徐静; 陈荣
发明公开了一种基于谱聚类算法的选择性聚类集成方法,包括以下步骤:聚类成员生成;基于谱聚类算法选择代表成员;对代表成员进行集成;结束。本发明的显著优点是:实现简单且可以有效提升聚类集成的效果。
16 一种自动确定聚类中心的势能聚类算法 CN201611061909.3 2016-11-25 CN106557786A 2017-04-05 葛洪伟; 于晓飞; 李莉; 朱嘉钢
发明公开了一种自动确定聚类中心的势能聚类算法,主要解决基于势能的快速层次聚类算法(PHA)需人为设置聚类数目,且其分配机制仅依据距离大小,削弱了势能影响这两个缺陷。该方法首先求出每个数据点的势能,将各数据点势能从小到大排列起来,然后找到每个数据点的父节点并计算数据点到父节点的距离,接着计算各点的γi值,根据各点的γi值,在一维空间中使用K‑means算法对数据点进行聚类(K恒为2),选取数据点少的一类作为聚类中心集。确定聚类中心后,每个聚类中心各代表一类,将剩余数据点归入势能比其小且与其距离最近的样本所在类簇。本发明不仅能够自动确定聚类数目,而且具有更高的准确率,实用性更强。
17 一种基于尔科夫聚类算法的动态聚类方法 CN202111457725.X 2021-12-02 CN116258880A 2023-06-13 张陈欢
发明涉及一种基于尔科夫聚类算法的动态聚类方法,将数据集按照适合改进后的马尔科夫聚类算法的数据规模P进行批量聚类,即每次从数据集选取数据规模为P的数据集进行聚类,使用代表点算法在有新增数据时快速完成聚类更新,用相对较少的数据点来描述数据集的特点,对于新增数据和原有数据分别利用代表类簇的代表点进行聚类,并根据聚类结果进行类别合并从而完成聚类更新,从而减少每次参与聚类的数据量,提高聚类的效率。
18 一种改进初始聚类中心K-means聚类算法 CN202210200771.X 2022-04-19 CN116049702A 2023-05-02 程小辉; 邵平
发明公开一种基于改进初始聚类中心的K‑means聚类算法,其主要解决K‑means聚类算法对初始聚类中心需要从数据中随机产生,导致聚类后的结果不稳定,且聚类结果较依赖于聚类中心的问题。该算法首先计算两两样本之间的相关度,根据设定的阈值,将相关度小的样本认定为利群样本,进行剔除,在剩余样本数据中再选取若干个聚类中心,接着用K‑means算法对剩余数据进行数据分析的过程。
19 一种基于谱聚类的自加权多视图聚类算法 CN202211431874.3 2022-11-16 CN115935217A 2023-04-07 袁广霄; 徐浩琦
发明公开了一种基于谱聚类的自加权多视图聚类算法,包括以下步骤:A、输入原始数据集,原始数据 ,视图数 ,簇个数;B、输出恰有个连通分量的全局图;C、初始化全局图;D、对数据的每一个视图,求得当前具有最佳邻居分配的 ;E、对每一个样本,更新 ;F、利用的前个最小的特征值对应的特征向量组成;G、重复步骤E、F,直到恰有 个连通分量;H、重复步骤D‑G直到算法收敛。本发明通过对相似度矩阵使用秩约束,来使矩阵的连通分量个数与簇个数相同,直接通过图的结构得到聚类结果,通过最小化全局图与各单视图优化后的相似度矩阵之间的距离,来学习得到最终的相似度图。通过添加自动加权方式,减少了模型的参数个数,使得模型具有更好的健壮性。
20 一种基于聚类算法的电用户聚类方法 CN201811230748.5 2018-10-22 CN109522934A 2019-03-26 赵志宇; 周源; 高宇; 吕维新; 彭剑锋; 郭超; 李嫣然
申请公开了一种基于聚类算法的电用户聚类方法,以电力营销系统的业务数据作为分析对象,通过数据预处理、数据过滤、以及特征聚类等多个算法过程,把庞大且零散业务数据聚类成行为相似的用户群。电力企业的管理人员对聚类成的用户群进行分析,找出直观的、有价值的信息,快速发现电力业务各个属性值之间的关联性,为电力业务的管理提供更可靠的方法,为电力客户提供更优质的服务。
QQ群二维码
意见反馈