王洋,涂登彪,安明远,孙凝晖,王伟平.层次凝聚聚类算法的动态分析与准则函数设计[J].高技术通讯(中文),2012,22(11):1169~1175 |
层次凝聚聚类算法的动态分析与准则函数设计 |
Dynamic analysis of hierarchical agglomerative clustering algorithm and design of criterion functions |
修订日期:2011-04-25 |
DOI:10.3772/j.issn.1002-0470.2012.11.010 |
中文关键词: 层次凝聚聚类(HAC)算法, 准则函数, 模块性, 聚类分析 |
英文关键词: words: hierarchical agglomerative clustering (HAC) algorithm, criterion function, modularity, cluster analysis |
基金项目:863计划(2009AA01A129)和国家自然科学基金(60903047)资助项目 |
作者 | 单位 | 王洋 | 中国科学院研究生院;中国科学院计算机系统结构重点实验室 | 涂登彪 | 国家计算机网络应急技术处理协调中心 | 安明远 | 中国科学院研究生院 | 孙凝晖 | 中国科学院计算机系统结构重点实验室 | 王伟平 | 中国科学院计算机系统结构重点实验室 |
|
摘要点击次数: 3425 |
全文下载次数: 2500 |
中文摘要: |
为提高层次凝聚聚类(HAC)算法的执行效率和结果质量,对其进行了动态分析,研究了一次合并对后续合并的影响。分析表明,合并两个类会生成一个新类,并使被合并的类的共享邻居的邻居数减小1;当新生成的类或邻居数减小的类参与后续合并时,会影响执行效率;一次合并会改变参与合并的类和它们的候选邻居之间的准则函数值,从而影响后续合并提高质量的程度。基于上述分析并结合模块性的定义,研究了现有准则函数对凝聚过程的影响以及它们的缺陷,并设计了两个新的准则函数。在大量数据集上的实验表明,新的准则函数提高了层次凝聚聚类算法的执行效率和结果质量。 |
英文摘要: |
|
查看全文
查看/发表评论 下载PDF阅读器 |
关闭 |