雷洁,赵瑞雪,李思经,鲜国建,寇远涛.知识图谱驱动的科研档案大数据管理系统构建研究[J].数字图书馆论坛,2020,(2):19~27 |
知识图谱驱动的科研档案大数据管理系统构建研究 |
Construction of Knowledge Graph for Scientific Research Archives Big Data Management System |
投稿时间:2020-02-03 |
DOI:10.3772/j.issn.1673-2286.2020.02.003 |
中文关键词: 科研档案本体;知识图谱;语义关联;碎片化加工;机器学习;Jena |
英文关键词: Scientific Research Archives Ontology; Knowledge Graph; Semantic Association; Fragmentation; Machine Learning; Jena |
基金项目:本研究得到公益性科研院所基本科研业务费项目“信息所档案数字化管理调研与设计”(编号:JBYW-AII-2017-28)、中国农业科学院科技创新工程项目重点任务“多源数据融合与知识组织增值”(编号:CAAS-ASTIP-2017-AII)及国家科技图书文献中心专项“文献元数据集成加工管理系统”(编号:2018XM34)资助。 |
作者 | 单位 | 雷洁 | 中国农业科学院农业信息研究所 | 赵瑞雪 | 中国农业科学院农业信息研究所 农业农村部农业大数据重点实验室 | 李思经 | 中国农业科学院农业经济与发展研究所 | 鲜国建 | 中国农业科学院农业信息研究所 农业农村部农业大数据重点实验室 | 寇远涛 | 中国农业科学院农业信息研究所 农业农村部农业大数据重点实验室 |
|
摘要点击次数: 2670 |
全文下载次数: 2765 |
中文摘要: |
为实现档案资源的智能采集、语义化组织与档案大数据的统计分析,探索科研档案智能管理新路径,本文基于应用编辑工具Protégé、建模语言OWL建立的计算机可理解的科研档案知识图谱语义模型,依据档案大数据管理流程,针对多种档案类型的资源进行数据解析、抽取和结构化处理,并对各类实体进行识别、抽取与消歧,以及语义关系的计算、关联、校对、审核等。利用本体、知识图谱、机器学习等语义技术对科研档案核心知识资源进行组织和表示,实现档案智能化采集与归档、档案数据碎片化加工、档案数据自动抽取与智能识别、语义关联以及档案数据审核与发布等功能,推动科研档案智能管理。 |
英文摘要: |
In order to realize the intelligent collection of archive resources, the semantic organization and statistical analysis of archive big data, and explore a new path for the intelligent management of scientific research archives, this paper is based on the computer-understandable scientific archive knowledge map semantic model established by the editing tool Protégé and modeling language OWL. According to the archive big data management process, data analysis, extraction and structured processing are performed for multiple archive types of resources, and various entities are identified, extracted and disambiguated, and the semantic relationship calculation, association, proofreading, auditing, etc. Use ontology, knowledge map, machine learning and other semantic technologies to organize and represent the core knowledge resources of scientific research archives, to achieve intelligent collection and archiving of archives, fragmentation and processing of archive data, automatic extraction and intelligent identification of archive data, semantic association and knowledge retrieval, And file data review and release functions to promote intelligent management of scientific research files. |
查看全文
查看/发表评论 下载PDF阅读器 |
关闭 |
|
|
|