王文玲,曲云鹏.网络资源存档数据质量问题初探[J].数字图书馆论坛,2018,(4):8~13 |
网络资源存档数据质量问题初探 |
An Overview of the Issues of Data Quality in Web Archiving |
|
DOI: |
中文关键词: 网络资源存档;数据质量;质量评价;质量保证 |
英文关键词: Web Archiving;Data Quality;Quality Assessment;Quality Assurance |
基金项目: |
作者 | 单位 | 王文玲 | 中国国家图书馆 | 曲云鹏 | 中国科学院文献情报中心 |
|
摘要点击次数: 2137 |
全文下载次数: 1400 |
中文摘要: |
网络资源存档的数据质量是影响网络资源存档工作成败的主要因素之一,本文探讨如何开展网络资源存档数据质量评价,在分析网络资源存档数据质量问题的表现及其成因的基础上,提出解决网络资源存档质量问题的方法体系.该体系以存档数据为中心,严格按照既定的业务标准及工作规范,利用现有软件工具对采集过程进行全面的数据质量检查,确保获取高质量的存档数据. |
英文摘要: |
Data quality issue is one of the key factors affecting the result of web archiving. The aspects of assessing data quality in web archiving are clarified in this article. Then the representations and the cause of data quality issues are analyzed. At last a framework of methodologies is developed to solve those issues. In this data-centered framework, business standards and working specifications are complied strictly, all kinds of softwares and tools are used to perform comprehensive data checking during the harvesting period to ensure high data quality. |
查看全文
查看/发表评论 下载PDF阅读器 |
关闭 |