<?xml version="1.0" encoding="utf-8"?>
<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom" xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005">
<channel xmlns:cfi="http://www.microsoft.com/schemas/rss/core/2005/internal" cfi:lastdownloaderror="None">
<title cf:type="text"><![CDATA[数字图书馆论坛 -->数据规范与计算]]></title>
<item>
<title xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="text"><![CDATA[NSTL大数据管理与计算平台的设计与应用实践]]></title>
<link><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202007006&flag=1]]></link>
<description xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="html"><![CDATA[本文针对国家科技图书文献中心（National Science and Technology Library，NSTL）业务流程再造目标，设计了满足NSTL需求的大数据管理和计算平台，提出了平台的业务架构、技术架构和平台构建的方案，并在大数据治理流程、分布式计算和微服务等方面开展了应用实践。大数据管理和计算平台建设解决了多源异构数据的存储问题和计算瓶颈，提高了数据管理和计算能力，为NSTL从文献服务向知识服务转变打下了坚实的数据平台基础。]]></description>
<pubDate>2020/7/27 17:37:39</pubDate>
<category><![CDATA[数据规范与计算]]></category>
<author><![CDATA[董智鹏，常志军，张建勇，钱力]]></author>
<guid><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202007006&flag=1]]></guid><cfi:id>3</cfi:id><cfi:read>true</cfi:read></item>
<item>
<title xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="text"><![CDATA[开放关联趋势下NSTL规范控制工作走向]]></title>
<link><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202007007&flag=1]]></link>
<description xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="html"><![CDATA[本文旨在探索开放关联趋势下国家科技图书文献中心（National Science and Technology Library，NSTL）规范控制的发展方向，促进NSTL规范数据资源在网络时代充分发挥应用价值。本文首先分析新的时代背景下规范控制的发展趋势，包括规范内容和数据模型的转变。一方面，规范内容逐渐由规范名称到唯一标识符到真实世界实体，各图书情报机构纷纷将规范数据发布为关联数据并建立与其他数据集的连接；另一方面，规范数据模型由MARC转为一系列以实体关系为基础的模型。接着，在回顾NSTL的规范控制工作的基础上，分析其进展与局限。并且基于发展趋势与NSTL现状，分析NSTL规范控制未来的发展方向。最后，提出三方面的发展建议：一是推进规范数据从封闭单一的“记录”数据走向开放关联的实体关系数据；二是推动规范数据向更广泛围内的第三方开放，开发基于关联规范数据的数据服务；三是促进跨领域规范数据融合，实现联合档案馆、图书馆、博物馆等的关联应用和服务。]]></description>
<pubDate>2020/7/27 17:37:39</pubDate>
<category><![CDATA[数据规范与计算]]></category>
<author><![CDATA[张建勇，周毅，刘峥]]></author>
<guid><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202007007&flag=1]]></guid><cfi:id>2</cfi:id><cfi:read>true</cfi:read></item>
<item>
<title xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="text"><![CDATA[从人工密集型到计算密集型：NSTL数据库建设模式转型之路]]></title>
<link><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202007008&flag=1]]></link>
<description xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="html"><![CDATA[近年来，在国家科技图书文献中心（National Science and Technology Library，NSTL）业务流程再造总体规划指导下，NSTL数据库建设模式发生了深刻变化与全面转型。本文总结梳理了由“全自主加工”到“自主加工+第三方数据利用”，再到当前“多源异构文摘数据深度融合利用”的发展脉络，展现了NSTL数据库建设模式正从人工密集型向计算密集型转型的特点，而近十年来文摘数据加工与第三方数据利用情况印证了这一发展历程。在此基础上，本文以期刊文摘数据加工为例，重点探讨多源异构文摘数据深度融合利用模式，包括基本原则、总体框架、规则设计与算法实现、融合系统设计与实现。最后指出，NSTL数据库建设最终将实现从人工密集型到计算密集型、从加工流程驱动向多源大数据驱动的全面转型发展，也将为NSTL构建下一代新型、智能化的知识发现服务体系，提供坚实的数字科技文献大数据支撑。]]></description>
<pubDate>2020/7/27 17:37:39</pubDate>
<category><![CDATA[数据规范与计算]]></category>
<author><![CDATA[鲜国建，罗婷婷，赵瑞雪，张建勇，杨增秀]]></author>
<guid><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202007008&flag=1]]></guid><cfi:id>1</cfi:id><cfi:read>true</cfi:read></item>
</channel>
</rss>