袁军鹏,俞征鹿,苏成,马峥,杨志清,宿洁.作者重名辨识研究进展[J].数字图书馆论坛,2011,(10):60~65 |
作者重名辨识研究进展 |
A Survey of Author Name Disambiguation |
|
DOI: |
中文关键词: 作者重名;机器学习;社会网络;聚类 |
英文关键词: Name disambiguation; Machine learning; Social network; Clustering |
基金项目:国家自然科学基金(编号:70973118);中国科学技术信息研究所预研项目(YY-2010027). |
作者 | 单位 | 袁军鹏 | 中国科学技术信息研究所 | 俞征鹿 | 中国科学技术信息研究所 | 苏成 | 中国科学技术信息研究所 | 马峥 | 中国科学技术信息研究所 | 杨志清 | 中国科学技术信息研究所 | 宿洁 | 中央财经大学 |
|
摘要点击次数: 2119 |
全文下载次数: 1906 |
中文摘要: |
作者重名现象将降低文献检索和网络检索的准确性,影响文献数据搜集质量,增加基于作者个人层面分析评价的障碍.目前国内外学者提出了人工辨识、数据库字段修正、基于机器学习的重名辨识等多种方法来解决作者重名问题.文章总结作者重名辨识面临的问题,分析当前各辨识方法的特点以及不足之处,指明作者重名辨识特别是中国作者重名辨识的发展方向. |
英文摘要: |
Because of name variations, an author may have multiple names and multiple authors may share the same name. Name disambiguation affects the performance of document retrieval, web search, database integration, and may cause improper attribution to authors. This paper makes a thorough investigation of the whole problem, analyses the current characteristics of the various disambiguation methods and points out the direction of name disambiguation development |
查看全文
查看/发表评论 下载PDF阅读器 |
关闭 |
|
|
|