专利汇可以提供一种基于网格的密度峰值聚类方法及系统专利检索,专利查询,专利分析的服务。并且本 发明 提出一种基于网格的 密度 峰值聚类方法及系统,首先,将数据空间划分为等大小的矩形单元格,然后,分别将每个数据点映射到对应的单元格中,再统计每个单元格的数据信息,将每个单元格看作为一个数据点,最后使用密度峰值 算法 对单元格进行聚类。该方法不仅能够有效提高密度峰值算法的运行效率,很好地处理 大数据 集,发现任意形状的簇,有效处理高维数据,并能很好地处理噪声孤立点,具有很好地聚类效果。,下面是一种基于网格的密度峰值聚类方法及系统专利的具体信息内容。
1.一种基于网格的密度峰值聚类方法及系统,其特征在于,利用网格思想将数据空间划分为等大小的网格单元,然后对数据进行初始化聚类,将数据点映射到对应的网格单元中,并统计网格单元的数据信息,再将每个单元格看作为一个数据点,使用DPC算法对单元格进行聚类,得出聚类结果。
2.根据权利要求1所述的方法,其特征是,所述的数据集X={X1,X2,X3,……Xn}是一个n*d的矩阵,矩阵的每行表示一个数据点,每列表示一种属性,故这个数据集包含n个数据点,每个数据点有d种属性。
3.根据权利要求1所述的方法,其特征是,所述的初始化聚类是指:利用CLIQUE算法将数据空间每一维划分为等大小的网格单元,然后将所有数据点映射到对应单元格,并统计每个单元格的数据点个数作为此单元格的局部密度ρi。
4.根据权利要求1所述的方法,其特征是,所述的使用DPC算法对单元格进行聚包括:
步骤1:将划分好的网格单元看作为一个数据点;
步骤2:分别取每个单元格左下标计算两两单元格之间的距离,构成距离矩阵dij;
步骤3:利用公式 计算单元格与具有更高密度的最近单元格之间的
距离属性δi;
步骤4:根据上述所求的局部密度属性ρi和距离属性δi,绘制单元格决策图,取两个属性值都高的单元格作为聚类中心;
步骤5:采用最近邻算法进行剩余单元格的聚类,将当前点归于密度等于或者高于当前点的最近点一类;
步骤6:采用DPC算法中边界值方法,计算出当前类别的边界,然后找出边界中密度最高点的密度作为阈值,去除当前类别中小于此密度的点。
5.一种实现上述任一权利要求所述方法的系统,其特征在于:网格划分模块和密度峰值聚类模块,其中网格划分模块将每个数据点进行初步聚类,首先划分数据空间成等大小网格单元,然后将数据点映射到对应网格中,统计网格单元中数据点的个数;密度峰值聚类模块先求解出每个网格单元的δi,然后绘制决策图选择聚类中心,分配所有剩余的网格单元,去除噪声单元,输出聚类结果。
标题 | 发布/更新时间 | 阅读量 |
---|---|---|
基于大数据的文博场馆综合安防管理平台 | 2020-05-08 | 927 |
基于大数据实时网络流量异常检测方法 | 2020-05-08 | 208 |
芯片测试方法、装置、电子设备及计算机可读介质 | 2020-05-08 | 155 |
一种基于JSBridge开发混合App的方法 | 2020-05-11 | 939 |
一种xml业务逻辑映射到java业务逻辑的方法 | 2020-05-08 | 63 |
一种用于提升烟草烘丝机生产稳定性的系统及方法 | 2020-05-11 | 567 |
一种并行消息处理方法、系统及相关装置 | 2020-05-08 | 976 |
面向慢性病康复的精准运动大数据智能预测、分析及优化系统 | 2020-05-08 | 582 |
基于大数据的定价方法、装置、计算机设备及存储介质 | 2020-05-08 | 373 |
一种具有智能调节散热功能的大数据服务器 | 2020-05-11 | 376 |
高效检索全球专利专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。
我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。
专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。