陆伟,刘屹,孟睿,陈英杰.基于域加权聚类算法的网络情热点话题探测[J].数字图书馆论坛,2011,(8):50~56 |
基于域加权聚类算法的网络情热点话题探测 |
Hot Topics Detection of Web Public Opinion Based on Field-weighted Clustering Algorithm |
|
DOI: |
中文关键词: 网络舆情;域加权;热点话题发现;聚类算法 |
英文关键词: Web public opinion, Field-weighted, Hot topics detection, Clustering algorithm |
基金项目:本项目为教育部人文社会科学规划项目“专家专长智能识别与检索系统实现研究”(项日编号:09yja870021)和教育部人文社科重点研究基地重大项日“面向细粒度的网络信息检索模型及框架构建研究”成果之一. |
作者 | 单位 | 陆伟 | 武汉大学 | 刘屹 | 武汉大学 | 孟睿 | 武汉大学 | 陈英杰 | 武汉大学 |
|
摘要点击次数: 2092 |
全文下载次数: 1419 |
中文摘要: |
面对自由无序的网络舆情信息,对舆情组织方式的研究体现出重要研究意义.文章提出一种网络舆情信息的组织方法,采用域加权的方式,通过一种single-pass增量算法聚类实现面向主题的舆情信息组织,即对新闻主题或新闻事件有较强表达能力的域进行加权处理以突出该主题或事件,再以无监督自动化的方式对无序的网络舆情信息进行聚类,进而发现热点话题,达到话题探测的目的.实验结果显示,聚类类簇均基于主题或事件,可以代表一个话题,F-measure评价值在85%以上,也进一步表明了本研究方法的有效性. |
英文摘要: |
The research of information organization shows great significance when dealing with large amount of unordered web public opinion information. In this paper, we introduce a new organization method for web public opinion. We highlight the subject by weighting text fields which are more effective to express the theme, and then deal with unsupervised clustering. By analyzing public opinion information, we realize the purpose of topic detection. In this method, the F-measure is more man 85%, which shows the effectiveness of letting clusters represent themes. |
查看全文
查看/发表评论 下载PDF阅读器 |
关闭 |
|
|
|