文章摘要
王洋,涂登彪,安明远,孙凝晖,王伟平.层次凝聚聚类算法的动态分析与准则函数设计[J].高技术通讯(中文),2012,22(11):1169~1175
层次凝聚聚类算法的动态分析与准则函数设计
Dynamic analysis of hierarchical agglomerative clustering algorithm and design of criterion functions
  修订日期:2011-04-25
DOI:10.3772/j.issn.1002-0470.2012.11.010
中文关键词: 层次凝聚聚类(HAC)算法, 准则函数, 模块性, 聚类分析
英文关键词: words: hierarchical agglomerative clustering (HAC) algorithm, criterion function, modularity, cluster analysis
基金项目:863计划(2009AA01A129)和国家自然科学基金(60903047)资助项目
作者单位
王洋 中国科学院研究生院;中国科学院计算机系统结构重点实验室 
涂登彪 国家计算机网络应急技术处理协调中心 
安明远 中国科学院研究生院 
孙凝晖 中国科学院计算机系统结构重点实验室 
王伟平 中国科学院计算机系统结构重点实验室 
摘要点击次数: 3428
全文下载次数: 2500
中文摘要:
      为提高层次凝聚聚类(HAC)算法的执行效率和结果质量,对其进行了动态分析,研究了一次合并对后续合并的影响。分析表明,合并两个类会生成一个新类,并使被合并的类的共享邻居的邻居数减小1;当新生成的类或邻居数减小的类参与后续合并时,会影响执行效率;一次合并会改变参与合并的类和它们的候选邻居之间的准则函数值,从而影响后续合并提高质量的程度。基于上述分析并结合模块性的定义,研究了现有准则函数对凝聚过程的影响以及它们的缺陷,并设计了两个新的准则函数。在大量数据集上的实验表明,新的准则函数提高了层次凝聚聚类算法的执行效率和结果质量。
英文摘要:
      
查看全文   查看/发表评论  下载PDF阅读器
关闭

分享按钮