张 勇1, 2 杨赛军 2 黄 华 2.CiteRank算法在文献多指标排序中的应用[J].中国科技资源导刊,2021,(4):32~37 |
CiteRank算法在文献多指标排序中的应用 |
Application of CiteRank in Multi-index Literature Ranking |
投稿时间:2021-03-26 |
DOI: |
中文关键词: 信息检索;文献排序;引证分析;PageRank;CiteRank |
英文关键词: information retrieval, literature ranking, citation analysis, PageRank, CiteRank |
基金项目: |
作者 | 单位 | 张 勇1, 2 杨赛军 2 黄 华 2 | (1.中国科学技术信息研究所,北京 100038;2.北京万方数据股份有限公司,北京 100038) |
|
摘要点击次数: 1104 |
全文下载次数: 1068 |
中文摘要: |
传统PageRank算法用于文献排序时主要关注引证关系,新文献被阅读的概率非常低。本文引入CiteRank算 法,结合出版时间、下载次数等指标,提出一种多维度混合排序的方法,应用于万方数据搜索引擎,对3亿篇文献进行
多指标混合排序。实证分析结果表明,该排序方法提高了新文献和热门文献被访问的概率,排序结果更加契合用户搜
索文献的需求。 |
英文摘要: |
PageRank algorithm only pays attention to the citation relationship when it is used in literature
ranking, and the probability of new literatures being read is very low. This paper conducts research from the
perspective of multi-dimensional sorting, introduces the CiteRank algorithm, uses data such as publication
year, download counts, etc., to perform multi-index mixed sorting on 300 million literatures. The results show
that the new sorting method improves the probability of new literatures and popular literatures being visited,
and the search result is more in line with users’ needs for finding literatures. |
查看全文
查看/发表评论 下载PDF阅读器 |
关闭 |
|
|
|