数图专题,张志雄.医学文献集合的主题抽取和主题聚类实践[J].数字图书馆论坛,2008,(9):32~36 |
医学文献集合的主题抽取和主题聚类实践 |
A Method for Topic Extraction and Clustering Based on Medical Literature |
投稿时间:2008-07-14 修订日期:2008-07-14 |
DOI: |
中文关键词: 主题抽取,BM25F,MMTx,文本挖掘,医学数据挖掘 |
英文关键词: Topic extraction, BM25F, MMTx , Text mining, Medical data mining |
基金项目:国家社会科学基金项目“从数字信息资源中实现知识抽取的理论和方法研究”(05BTQ006) |
|
摘要点击次数: 1324 |
全文下载次数: 671 |
中文摘要: |
文献中的重要关键词能够反映其核心主题,因此对文献主题的发现和抽取问题就转化为对文献中的重要关键词集合的抽取。本文在调研了国外在主题抽取和聚类方面采用的技术方法的基础上,提出了在医学学科领域从文本信息资源中抽取主题并进行主题领域判断的技术方案,并详细阐述了其中的主题聚类的技术环节。为了验证该技术方案的有效性,本文以骨关节炎领域为例,对本文提出的技术方案进行实践验证。验证的结果表明本文提出的技术方案有着实际的有效性。 |
英文摘要: |
Important keywords in academic papers reflect the central topics of the literature. Therefore, the extraction of topics has come to be the extraction of keyword groups. This paper first investigates the techniques for topic extraction and clustering used by overseas research circles, then proposes a technical scheme for extracting topics in text information resources in the medical field and for topic area identification. A detailed explanation of the techniques for topic clustering is given. To verify the validity of the scheme, this paper applies the scheme to the field of osteoarthritis research. The result proves the validity of the proposed scheme. |
查看全文
查看/发表评论 下载PDF阅读器 |
关闭 |