<?xml version="1.0" encoding="utf-8"?>
<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom" xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005">
<channel xmlns:cfi="http://www.microsoft.com/schemas/rss/core/2005/internal" cfi:lastdownloaderror="None">
<title cf:type="text"><![CDATA[数字图书馆论坛 -->知识组织]]></title>
<item>
<title xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="text"><![CDATA[BBC关联数据实现研究]]></title>
<link><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202009004&flag=1]]></link>
<description xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="html"><![CDATA[英国广播公司（British Broadcasting Corporation，BBC）是媒体领域内最早应用关联数据技术的成功案例。对BBC关联数据的实现步骤进行研究，以期为我国媒体机构的关联数据化提供发展思路。本文在大量相关文献调研基础上，结合关联数据发布原则，描述BBC数据模型及其本体，从实体抽取、实体归类、使用URI命名实体、建立CIS与DBpedia链接、发布数据五方面研究BBC发布关联数据的步骤。BBC关联数据在降低制作成本、及时更新数据以及改善用户体验等方面具有明显的应用优势，对于实现媒体领域的关联数据化具有深远且重要的意义。]]></description>
<pubDate>2020/9/30 17:19:21</pubDate>
<category><![CDATA[知识组织]]></category>
<author><![CDATA[贾君枝，梅玥]]></author>
<guid><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202009004&flag=1]]></guid><cfi:id>92</cfi:id><cfi:read>true</cfi:read></item>
<item>
<title xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="text"><![CDATA[文献资源组织中元数据集成建设问题研究]]></title>
<link><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202009005&flag=1]]></link>
<description xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="html"><![CDATA[海量数字资源的出版和信息环境的巨变给图书馆传统的文献资源组织方式带来了极大挑战，传统编目生成的粗粒度书目数据正在丧失文献组织与检索的主导地位，细粒度、语义化、规模化、关联化的文献元数据集成管理对图书馆的资源发现和智慧服务具有重要意义。文献服务机构需要重视文献元数据体系建设，对文献元数据进行结构化、系统化、关联化处理，注重元数据统一集成管理中的元数据收集、元数据标准制定、元数据整合、元数据协同共建与共享，构建国家层面的“大数据”级元数据集成体系，才能释放和提升文献资源价值，满足用户资源发现、知识关联和智慧服务的新需求。]]></description>
<pubDate>2020/9/30 17:19:21</pubDate>
<category><![CDATA[知识组织]]></category>
<author><![CDATA[杨永清，黄毕惠]]></author>
<guid><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202009005&flag=1]]></guid><cfi:id>91</cfi:id><cfi:read>true</cfi:read></item>
<item>
<title xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="text"><![CDATA[面向突发公共事件网络舆情分析的领域情感词典构建研究]]></title>
<link><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202009006&flag=1]]></link>
<description xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="html"><![CDATA[为了对突发公共事件网络舆情中的公众情感进行分析，本文构建了一种具有较好准确性和可靠性的面向网络舆情分析的领域情感词典。首先，基于现有通用情感词典在大规模网络舆论语料中进行情感词的识别和修正，将情感词分为7个大类和21个小类，并对情感词进行极性和强度标注，得到情感种子词典；其次，在情感种子词典的基础上利用Word2Vec模型和余弦相似度计算进行情感词扩展，得到新增情感词；再次，对新增情感词进行分类、极性和强度标注，最终构建一个领域情感词典；最后，选取新冠肺炎疫情事件的微博评论作为语料进行实验验证。结果，本文构建的词典对情感词的识别准确率为0.85，召回率为0.90，F1值为0.87，能够有效用于识别突发公共事件网络舆论中的情感类型和强度。]]></description>
<pubDate>2020/9/30 17:19:21</pubDate>
<category><![CDATA[知识组织]]></category>
<author><![CDATA[李长荣，纪雪梅]]></author>
<guid><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202009006&flag=1]]></guid><cfi:id>90</cfi:id><cfi:read>true</cfi:read></item>
<item>
<title xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="text"><![CDATA[国内外生物医学领域本体研究与实践进展]]></title>
<link><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202008003&flag=1]]></link>
<description xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="html"><![CDATA[本文通过文献调查法归纳总结近十年（2010—2019年）国内外生物医学领域本体文献，简要介绍国内外重要生物医学领域本体，从构建、整合、扩展3个方面归纳总结生物医学领域本体的相关研究，以及其在医学信息描述、查询扩展、知识库构建、术语相似度计算等方面的相关实践，并对未来发展趋势进行展望，以期为我国生物医学领域本体的构建与应用提供借鉴。]]></description>
<pubDate>2020/8/24 16:25:32</pubDate>
<category><![CDATA[知识组织]]></category>
<author><![CDATA[赵洁，司莉]]></author>
<guid><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202008003&flag=1]]></guid><cfi:id>89</cfi:id><cfi:read>true</cfi:read></item>
<item>
<title xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="text"><![CDATA[分类主题一体化词表的国内研究进展述评]]></title>
<link><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202008004&flag=1]]></link>
<description xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="html"><![CDATA[分类主题一体化词表是分类主题一体化思想的具体表现形式，可以更有效地组织信息资源。本文通过内容分析，对我国分类主题一体化词表的构成模式、实现方法、应用方式等进行系统梳理，旨在对当前理论研究及实践应用提供参考。研究结果显示：分类主题一体化词表在网络环境中的应用包括标引与检索、词表互操作、本体构建、关联数据发布、知识发现等多个方面；一体化词表的关联化、分面化以及集成化、可视化在未来研究中还需深入拓展。]]></description>
<pubDate>2020/8/24 16:25:32</pubDate>
<category><![CDATA[知识组织]]></category>
<author><![CDATA[姜冠兰，张敏]]></author>
<guid><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202008004&flag=1]]></guid><cfi:id>88</cfi:id><cfi:read>true</cfi:read></item>
<item>
<title xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="text"><![CDATA[NSTL联合目录资源描述发展与思考]]></title>
<link><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202008005&flag=1]]></link>
<description xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="html"><![CDATA[在系统梳理国家科技图书文献中心（National Science and Technology Library，NSTL）联合目录资源描述的发展历程及现状、分析科技文献资源变化以及中心新业务流程需求变化的基础上，提出新时期NSTL联合目录元数据体系重构方案，思考NSTL联合目录资源描述未来发展方向。]]></description>
<pubDate>2020/8/24 16:25:32</pubDate>
<category><![CDATA[知识组织]]></category>
<author><![CDATA[葛红梅，丁遒劲，徐晶晶，李军莲，梁芳，任慧玲]]></author>
<guid><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202008005&flag=1]]></guid><cfi:id>87</cfi:id><cfi:read>true</cfi:read></item>
<item>
<title xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="text"><![CDATA[面向外文科技文献的科技知识组织体系建设与应用]]></title>
<link><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202007004&flag=1]]></link>
<description xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="html"><![CDATA[为了实现海量外文科技文献信息的知识组织，促进文献信息内容的知识关联和知识发现，国家科技图书文献中心（National Science and Technology Library，NSTL）组织实施了“面向外文科技文献信息的知识组织体系建设和示范应用”的国家科技支撑计划项目，提出构建以内容建设为核心、加工协作和开放服务平台为依托，以自动处理智能检索和知识服务应用为根本的知识组织体系建设和示范应用。本文介绍了项目建设目标和实现思路，重点总结和分析项目的建设成果及应用效果，最后提出NSTL将围绕下一代国家科技创新开放知识服务平台的建设开展相关研究。]]></description>
<pubDate>2020/7/27 17:37:39</pubDate>
<category><![CDATA[知识组织]]></category>
<author><![CDATA[孙坦，鲜国建，黄永文，刘峥]]></author>
<guid><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202007004&flag=1]]></guid><cfi:id>86</cfi:id><cfi:read>true</cfi:read></item>
<item>
<title xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="text"><![CDATA[医学知识组织系统构建研究与应用实践]]></title>
<link><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202007005&flag=1]]></link>
<description xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="html"><![CDATA[医学知识组织系统是对医学领域重要概念及其语义关系的规范化描述，有助于实现海量医学知识的深度组织与有效利用，对推动医疗健康大数据的语义互联、共享共用及医药科技创新发展具有重要意义。本文全面阐述代表性中文医学知识组织系统的内容结构、规模体量及发展历程等基本情况，对其在术语服务、文献主题标引与主题检索、临床医学知识库构建等主要应用实践进行概要介绍，并对今后的发展趋势和研究重点进行总结和展望。]]></description>
<pubDate>2020/7/27 17:37:39</pubDate>
<category><![CDATA[知识组织]]></category>
<author><![CDATA[李晓瑛，李军莲，邓盼盼，冀玉静，夏光辉，李丹亚，胡铁军]]></author>
<guid><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202007005&flag=1]]></guid><cfi:id>85</cfi:id><cfi:read>true</cfi:read></item>
<item>
<title xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="text"><![CDATA[长期保存元数据在文物数字化保护项目中的应用]]></title>
<link><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202006002&flag=1]]></link>
<description xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="html"><![CDATA[保存元数据在数字资源长期保存过程中起着决定性作用。本文梳理分析PREMIS保存元数据的数据模型和数据字典，提出制定我国文物数字化保护保存元数据标准规范的思路，最后给出参考采用PREMIS 3.0并做本地化修改的文物保存元数据方案。]]></description>
<pubDate>2020/6/30 17:01:45</pubDate>
<category><![CDATA[知识组织]]></category>
<author><![CDATA[姜爱蓉，程变爱，郑小惠，姚飞]]></author>
<guid><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202006002&flag=1]]></guid><cfi:id>84</cfi:id><cfi:read>true</cfi:read></item>
<item>
<title xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="text"><![CDATA[以藏品为核心的知识图谱设计与应用]]></title>
<link><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202006003&flag=1]]></link>
<description xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="html"><![CDATA[在互联网时代，以藏品为核心的数字资源组织与应用成为博物馆智慧化建设的一项重要内容。本文通过对国家博物馆数据资源的研究与相关度分析，设计以藏品、多媒体、展览、项目、人员、机构、文献7类实体为核心的知识图谱，进而从知识抽取、知识融合、知识存储和知识应用4个方面设计了技术架构，重点分析知识图谱在知识抽取与知识融合中的关键技术问题，以及知识图谱在检索优化、智能推荐、可视化展示和智能问答领域的应用方式，以期对博物馆展览展示、文物保护、考古、修复和社教等业务的开展提供支撑。]]></description>
<pubDate>2020/6/30 17:01:45</pubDate>
<category><![CDATA[知识组织]]></category>
<author><![CDATA[刘芳，谢靖]]></author>
<guid><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202006003&flag=1]]></guid><cfi:id>83</cfi:id><cfi:read>true</cfi:read></item>
<item>
<title xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="text"><![CDATA[社会记忆视角下网络信息资源归档路径探析——以PANDORA项目为例]]></title>
<link><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202006004&flag=1]]></link>
<description xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="html"><![CDATA[网络信息资源归档对于维护数字文化遗产、留存互联网社会记忆有着重要的意义。世界上很多国家已经意识到这一问题的重要性，并开展了多元化的网络信息资源归档探索，澳大利亚PANDORA项目是其中经典的实践之一。本文以社会记忆的视角为切入点，选取PANDORA项目为典型案例，借鉴PEST分析框架，并增加文化要素的考量，探析PANDORA项目在管理、经济、社会、技术和文化要素上的建设经验，并在此基础上创新性地构建了网络信息资源归档路径框架，为我国网络信息资源归档和社会记忆延续提供借鉴和参考。]]></description>
<pubDate>2020/6/30 17:01:45</pubDate>
<category><![CDATA[知识组织]]></category>
<author><![CDATA[陈慧，乐茜，罗慧玉，罗思静]]></author>
<guid><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202006004&flag=1]]></guid><cfi:id>82</cfi:id><cfi:read>true</cfi:read></item>
<item>
<title xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="text"><![CDATA[大规模RDF三元组转换及存储工具比较研究]]></title>
<link><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202011002&flag=1]]></link>
<description xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="html"><![CDATA[富含语义知识的数据网络是实现大数据智能的基石。资源描述框架（Resource Description Framework，RDF）是用于描述网络资源的W3C标准。大规模转换、存储管理RDF三元组是构建关联数据网络或语义知识图谱，实现数据可查找、可访问、可交互、可再用的重要路径。本文选择国际主流的10种RDF三元组转换工具，以及6种广受欢迎的RDF存储系统，从技术原理、性能特点及应用场景等多个视角进行对比分析，并总结存在问题和不足。提出未来大规模RDF三元组数据转换与存储管理需要实现的目标是实现RDF抽取、转换和加载（ETL）的流程化和集成化，并重点支撑4类典型应用需求场景，包括从非RDF数据到RDF数据的转换，不同RDF数据格式之间的双向转换，RDF三元组在数据库之间的数据迁移，以及RDF数据的动态更新和进化管理。]]></description>
<pubDate>2020/12/18 18:58:41</pubDate>
<category><![CDATA[知识组织]]></category>
<author><![CDATA[李悦，孙坦，赵瑞雪，李娇，黄永文，罗婷婷，鲜国建]]></author>
<guid><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202011002&flag=1]]></guid><cfi:id>81</cfi:id><cfi:read>true</cfi:read></item>
<item>
<title xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="text"><![CDATA[新版RDA探微——3R项目稳定阶段略述]]></title>
<link><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202010006&flag=1]]></link>
<description xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="html"><![CDATA[RDA指导委员会2019年发布的“3R项目完成声明”，标志着以RDA工具包重构和再设计为目标的3R项目已阶段性完成，实现了基于IFLA图书馆参考模型对RDA内容进行修订和优化用户界面的预期目标。与原版RDA相较，新版RDA从体例编排到内容编制均有较大变化。本文回顾新版RDA的发展历程，从内容和结构两方面梳理其主要变化，为今后在关联数据环境下更好地理解和运用RDA奠定基础。]]></description>
<pubDate>2020/11/6 17:05:00</pubDate>
<category><![CDATA[知识组织]]></category>
<author><![CDATA[丁政，蔡丹]]></author>
<guid><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202010006&flag=1]]></guid><cfi:id>80</cfi:id><cfi:read>true</cfi:read></item>
<item>
<title xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="text"><![CDATA[基于信息资源聚合的交互式报告生成模型研究]]></title>
<link><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202010007&flag=1]]></link>
<description xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="html"><![CDATA[首次提出基于信息资源聚合的交互式报告生成模型，该模型的应用旨在探索一种新的信息聚合服务方式，促进用户对特定领域信息资源的快速获取和高效利用。本文首先从面向用户需求的信息资源知识体系构建、信息资源遴选采集、信息资源整理序化、信息资源细粒度聚合4个方面构建模型，然后对报告生成的关键环节进行分步骤解析，最后以生成茶产业对外合作发展报告为例进行原型实现，详述报告生成过程及主要功能，实证表明能够明显减少领域用户获取多来源渠道信息的时间，提升信息输入的效率；能够一键生成定制化报告，操作简单便捷；报告中段落可按国家、年份等多维度检索查询，提升查找资料或素材的效率。]]></description>
<pubDate>2020/11/6 17:05:00</pubDate>
<category><![CDATA[知识组织]]></category>
<author><![CDATA[袁雪，刘敏娟，刘洪冰，王新，赵婉婧，江浩]]></author>
<guid><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202010007&flag=1]]></guid><cfi:id>79</cfi:id><cfi:read>true</cfi:read></item>
<item>
<title xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="text"><![CDATA[资源同步框架ResourceSync及其在机构知识库中的应用场景]]></title>
<link><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202106007&flag=1]]></link>
<description xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="html"><![CDATA[资源同步框架规范ResourceSync可实现互联网上不同系统之间的资源同步。本研究通过对Resource Sync的框架结构、同步过程、资源发现机制的分析，阐述其用于资源同步的基本原理，描述其在机构知识库中的应用场景及应注意的问题及对策。该框架规范在机构知识库中的应用可实现资源转移、批量发现、长期保存等新功能。机构知识库可通过ResourceSync框架规范执行与镜像库、用户、资源提供者之间的资源同步操作。]]></description>
<pubDate>2021/8/20 17:37:44</pubDate>
<category><![CDATA[知识组织]]></category>
<author><![CDATA[王超]]></author>
<guid><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202106007&flag=1]]></guid><cfi:id>78</cfi:id><cfi:read>true</cfi:read></item>
<item>
<title xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="text"><![CDATA[可视化技术在馆藏文物资源信息组织与服务中的应用研究]]></title>
<link><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202106008&flag=1]]></link>
<description xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="html"><![CDATA[对馆藏文物资源进行信息组织既是为更好地对文物进行有效的数字化保护，也是为向用户提供更好的馆藏文物资源信息服务，使文物资源得以传承并发挥出更大的价值。本文通过对馆藏文物资源信息组织过程的系统分析，从信息获取、信息预处理、元数据加工、本体组织以及可视化表达等5个方面构建可视化技术在馆藏文物资源信息组织与服务中应用的路径，并以青铜器为例进行实证研究。研究发现，依据此路径，可以对馆藏文物信息资源进行数据关联发现、知识关联发现以及关联知识可视化等操作，更好地提升馆藏文物知识服务的水平。]]></description>
<pubDate>2021/8/20 17:37:44</pubDate>
<category><![CDATA[知识组织]]></category>
<author><![CDATA[李迎迎，孙玉琦]]></author>
<guid><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202106008&flag=1]]></guid><cfi:id>77</cfi:id><cfi:read>true</cfi:read></item>
<item>
<title xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="text"><![CDATA[面向多源异构科技信息治理的元数据标准规范体系构建]]></title>
<link><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202104010&flag=1]]></link>
<description xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="html"><![CDATA[为开展大数据环境下多类型、多来源、异构化科技信息的汇聚治理，实现大数据资源的规范化描述与互联互通，提高数据资源的可发现、可利用和开放共享能力，本文基于元数据理论和知识对象建模思想，构建了一套广泛适用的、可扩展的元数据标准规范体系，覆盖13类通用容器、24类资源元素集描述规范及28个规范编码表，并编制了配套的XML Schema形式化描述规范，实现对多类多源异构元数据向统一的XML格式转化、验证和解析等自动化处理。该规范体系已在中国工程科技知识中心开展了应用验证，指导30余个分中心完成24类数据资源超过亿级数据的转化汇交，有力支撑了工程科技“元数据海”的建设，快捷、高效地实现了近百类专业领域特色资源元数据标准规范的定制与应用。]]></description>
<pubDate>2021/7/9 18:48:24</pubDate>
<category><![CDATA[知识组织]]></category>
<author><![CDATA[罗婷婷，赵瑞雪，李娇，傅智杰，武丽丽，黄永文，鲜国建]]></author>
<guid><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202104010&flag=1]]></guid><cfi:id>76</cfi:id><cfi:read>true</cfi:read></item>
<item>
<title xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="text"><![CDATA[图书馆馆藏元数据发展策略分析]]></title>
<link><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202104011&flag=1]]></link>
<description xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="html"><![CDATA[图书馆作为元数据生产与提供的重要机构，在元数据制订、管理及服务中积累了丰富的经验。本文首先探讨图书馆馆藏元数据可能产生的价值，基于此对当前图书馆元数据发展存在的问题进行分析，认为其固有的管理观念、方式及手段一定程度上阻碍了元数据作用的有效发挥；最后针对性地提出包含元数据资产管理、质量、服务等在内的发展策略，旨在保障元数据在未来应用中能够被发现、获取、互操作及重用。]]></description>
<pubDate>2021/7/9 18:48:24</pubDate>
<category><![CDATA[知识组织]]></category>
<author><![CDATA[张茹]]></author>
<guid><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202104011&flag=1]]></guid><cfi:id>75</cfi:id><cfi:read>true</cfi:read></item>
<item>
<title xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="text"><![CDATA[面向多源数据深度融合的农作物病虫害本体构建研究]]></title>
<link><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202102002&flag=1]]></link>
<description xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="html"><![CDATA[我国农作物病虫害种类繁多，每年因病虫害的影响导致农作物产量、农民收入的损失非常严重。由于农作物病虫害数据来源广泛，数据表示、组织方式等不尽相同，信息资源处于无序与相对混乱的状态，导致领域知识难以被有效利用。本文借鉴融合多来源、多载体的专业化高质量知识资源，尝试将农作物病虫害领域本体与通用的科技文献本体以及传统的知识组织体系进行深度融合，并对本体进行形式化表示，促进领域知识的共享与语义互操作，为构建基于多源高质量数据的领域知识图谱奠定语义基础，以期实现以科技为支撑助力农作物病虫害的科学防治，为农业新型智能化知识服务实践提供相关思路。]]></description>
<pubDate>2021/5/14 10:20:03</pubDate>
<category><![CDATA[知识组织]]></category>
<author><![CDATA[李悦，孙坦，鲜国建，赵瑞雪，李娇，黄永文，罗婷婷]]></author>
<guid><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202102002&flag=1]]></guid><cfi:id>74</cfi:id><cfi:read>true</cfi:read></item>
<item>
<title xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="text"><![CDATA[融合专题知识和科技文献的科研知识图谱构建]]></title>
<link><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202101002&flag=1]]></link>
<description xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="html"><![CDATA[本文为解决领域科技文献与专题价值的割裂问题提出深度融合科技文献、科研活动等科研对象与领域专题数据资源的图谱构建方法。通过主题词关联设计，构建包含期刊论文、期刊、科研机构、科研人员及专题实体类型的科研本体，选取机器学习专题构建科研知识图谱，并基于图数据库Neo4J进行图谱管理与查询验证。该专题科研知识图谱可以支持单实体/属性、多实体事实性问题的复杂图谱查询，有效揭示专题、科技文献的关联关系，具有较强的应用价值，可以为面向文献数据的智能知识服务提供新的思路和方向。]]></description>
<pubDate>2021/4/9 14:51:07</pubDate>
<category><![CDATA[知识组织]]></category>
<author><![CDATA[李娇，孙坦，黄永文，鲜国建，罗婷婷，赵瑞雪]]></author>
<guid><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202101002&flag=1]]></guid><cfi:id>73</cfi:id><cfi:read>true</cfi:read></item>
<item>
<title xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="text"><![CDATA[书目资源的开放关联化实现研究]]></title>
<link><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202101003&flag=1]]></link>
<description xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="html"><![CDATA[虽然关联数据在国内图书情报领域的认知已普及，但在书目资源上的应用推进仍较缓慢。本文引介联合国粮食及农业组织发布的《书目数据开放关联化指南》（LODE-BD），通过借鉴国外书目资源的关联数据实践经验，以期促进国内信息资源序化理论与实践的融合。本文重点辨析了基于RDF的三对基本概念，解读了M2B概念模型，分析了元数据模式的通用属性组设计，介绍了LODE-BD的决策树选择流程创新做法。最后在分析LODE-BD的基础上，提出书目资源开放关联化的5圈层结构，为国内书目资源的开放关联化提供系统化实施参考。]]></description>
<pubDate>2021/4/9 14:51:07</pubDate>
<category><![CDATA[知识组织]]></category>
<author><![CDATA[范炜，胡春晖]]></author>
<guid><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202101003&flag=1]]></guid><cfi:id>72</cfi:id><cfi:read>true</cfi:read></item>
<item>
<title xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="text"><![CDATA[基于多属性规则的生物医学语义关系研究]]></title>
<link><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202101004&flag=1]]></link>
<description xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="html"><![CDATA[生物医学领域文献指数级增长亟需快速识别出领域内核心且关键的语义关系，开展领域知识发现研究。本文借鉴DisGeNET基于规则的关系得分方法设计思想，在专家咨询基础上，提出生物医学领域语义关系具有可靠性、重要性和新颖性3种属性，设定每种属性对应的指标及定量计算方法。通过分析结直肠癌领域关系计算结果，验证本文所提关系得分方法在关系重要性排序方面的有效性。该方法考虑维度更加全面，为生物医学领域知识图谱构建、知识发现等提供有益参考。]]></description>
<pubDate>2021/4/9 14:51:07</pubDate>
<category><![CDATA[知识组织]]></category>
<author><![CDATA[范少萍，安新颖]]></author>
<guid><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202101004&flag=1]]></guid><cfi:id>71</cfi:id><cfi:read>true</cfi:read></item>
<item>
<title xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="text"><![CDATA[优化关键词利用策略的共词分析研究]]></title>
<link><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202112007&flag=1]]></link>
<description xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="html"><![CDATA[本文提出关键词利用策略的优化方案，解决小数量级概念失焦、关键词组概念缺失等问题，优化共词分析结果，以发现潜在研究热点，拓展研究热点主题识别的深度。关键词利用策略优化方案在高频词共词分析的基础上，引入关键词与关键词组相结合的处理方案，通过调整数据集范围，实现共词分析结果优化。实证部分以“主动健康”主题为例，使用DDA软件，完成基于关键词利用策略优化方案的共词分析，探测主动健康的学科主题热点。在初始发现的5类研究领域、12个热点之外，基于关键词利用策略优化方案的共词分析扩展识别了7个潜在热点话题，补充发现5个复合词组表达的研究概念。关键词利用策略优化方案令小数量级概念聚焦形成类团，在聚类过程中得到表达，令关键词组代表的概念得到完整呈现。]]></description>
<pubDate>2022/1/26 0:00:00</pubDate>
<category><![CDATA[知识组织]]></category>
<author><![CDATA[马宇驰，牟冬梅，杨鑫禹]]></author>
<guid><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202112007&flag=1]]></guid><cfi:id>70</cfi:id><cfi:read>true</cfi:read></item>
<item>
<title xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="text"><![CDATA[碑刻资源语义化组织研究]]></title>
<link><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202112008&flag=1]]></link>
<description xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="html"><![CDATA[碑刻作为一种不可再生的宝贵历史文化遗产，承载着文明和文化的记忆，对其进行语义化组织研究具有重要意义。本文结合关联数据与国际图像互操作框架（IIIF）进行碑刻资源语义化组织的探索。首先，对碑刻资源语义化组织框架进行设计，为碑刻资源从采集描述到组织发布提供一套完整可行的方案。其次，以镇江焦山碑林为例，基于Drupal内容管理平台进行关联数据应用与IIIF服务集成，实现碑刻资源概念间关系的关联发布及可视化展示，验证碑刻资源语义化组织框架的可行性，为碑刻资源的深度开发和服务提供借鉴。]]></description>
<pubDate>2022/1/26 0:00:00</pubDate>
<category><![CDATA[知识组织]]></category>
<author><![CDATA[李永卉，刘沁芃，周树斌，屠纪军]]></author>
<guid><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202112008&flag=1]]></guid><cfi:id>69</cfi:id><cfi:read>true</cfi:read></item>
<item>
<title xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="text"><![CDATA[资源描述标准的国际最新进展及对我国资源描述工作的影响]]></title>
<link><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202111002&flag=1]]></link>
<description xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="html"><![CDATA[在关联数据和语义网发展推动下，图书馆资源描述标准和书目数据格式正在发生巨变。本文从资源描述标准和书目数据格式的历史演变出发，重点分析当前书目数据的环境、国际资源描述标准和书目数据技术的研究状况，对我国标准规范建设和应用、书目数据向关联数据转换提出了思考和建议。]]></description>
<pubDate>2021/12/24 18:39:40</pubDate>
<category><![CDATA[知识组织]]></category>
<author><![CDATA[宋文]]></author>
<guid><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202111002&flag=1]]></guid><cfi:id>68</cfi:id><cfi:read>true</cfi:read></item>
<item>
<title xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="text"><![CDATA[视频档案资源多层级语义标注框架构建研究]]></title>
<link><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202111003&flag=1]]></link>
<description xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="html"><![CDATA[视频档案资源是语义最为丰富的档案资源，对其进行语义标注是视频档案资源能被有效利用的基础和前提。本文在对国内外相关研究成果梳理分析的基础上，结合视频档案资源特性，提出多层级语义标注的理念，阐释对视频档案资源多层级语义标注的意义，进而设计了视频档案资源多层级语义标注框架、多维语义信息提取模板和视频档案语义标注本体模型等。最后基于实例分析，从视频档案资源语义描述预处理、视频档案主题词汇集的完善以及如何引导用户参与语义标注工作等方面给出具体的应用建议。]]></description>
<pubDate>2021/12/24 18:39:40</pubDate>
<category><![CDATA[知识组织]]></category>
<author><![CDATA[吕元智]]></author>
<guid><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202111003&flag=1]]></guid><cfi:id>67</cfi:id><cfi:read>true</cfi:read></item>
<item>
<title xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="text"><![CDATA[面向数字记忆开发利用的档案检索模型构建研究]]></title>
<link><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202111004&flag=1]]></link>
<description xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="html"><![CDATA[本文从构建目标、数字记忆开发利用途径和档案组织粒度三方面探讨数字记忆和档案检索之间的逻辑关系，并在此基础上构建面向数字记忆开发利用的档案检索模型。模型主要分为档案信息中数字记忆要素提取、要素语义关系提取和索引库建立及匹配。其中数字记忆要素提取分为基于命名实体识别方法的实体要素提取，以及基于LDA模型的主题提取；要素语义关系提取分为基于神经网络的实体关系提取和基于空间向量相似性的主题关系提取；索引库建立及匹配模块旨在通过检索数字记忆要素字段获取档案承载记忆的基因链，实现记忆的完整再现，促进档案价值的开发利用。]]></description>
<pubDate>2021/12/24 18:39:40</pubDate>
<category><![CDATA[知识组织]]></category>
<author><![CDATA[房小可]]></author>
<guid><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202111004&flag=1]]></guid><cfi:id>66</cfi:id><cfi:read>true</cfi:read></item>
<item>
<title xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="text"><![CDATA[面向科研关系网络的发现算法研究]]></title>
<link><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202209004&flag=1]]></link>
<description xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="html"><![CDATA[采用数据挖掘等技术手段自动发现科研关系网络中蕴含的社区结构，对于有针对性地组建科研队伍、维护项目申报和职称评审等程序的公平公正具有重要意义。现有的科研关系网络发现方法大多存在算法复杂度高、片面依赖论文合著和项目合作关系等问题，因此本文基于经典的PageRank算法，提出一种面向科研关系网络的发现算法。首先刻画科研关系模型，建立科研关系网络，然后以单个科研人员为核心通过对局部网络进行挖掘分析，快速发现其所在的社区，不仅降低了社区发现的复杂度，而且提高了所发现社区的可用性，对我国科技管理工作起到一定的推动作用。]]></description>
<pubDate>2022/9/23 0:00:00</pubDate>
<category><![CDATA[知识组织]]></category>
<author><![CDATA[王卓昊，徐晨阳，江俊鹏，王东]]></author>
<guid><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202209004&flag=1]]></guid><cfi:id>65</cfi:id><cfi:read>true</cfi:read></item>
<item>
<title xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="text"><![CDATA[复杂表格数据化中的单元格语义关系识别研究]]></title>
<link><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202209005&flag=1]]></link>
<description xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="html"><![CDATA[复杂表格能够以简单、直观的方式描述数据，被广泛应用于各行各业，然而，复杂表格具有结构复杂、单元格类型多样、表格文档构成方式不一等问题，需要进行数据化处理后才能实现共享与复用。因此，本文构建一种基于无监督学习的单元格语义关系识别模型来实现复杂表格数据化，首先利用机器视觉技术实现复杂表格分割，然后基于表格结构和内容相似度识别同模板表格，在此基础上，结合表头单元格、说明性单元格、表体单元格3类单元格的取值、位置特点，设置启发式规则进行单元格语义关系的识别，最后通过实证研究验证本文的方法能够在复杂表格数据化中取得较高的准确率和召回率，具有可行性。]]></description>
<pubDate>2022/9/23 0:00:00</pubDate>
<category><![CDATA[知识组织]]></category>
<author><![CDATA[林鑫，余华娟，闫奕臻]]></author>
<guid><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202209005&flag=1]]></guid><cfi:id>64</cfi:id><cfi:read>true</cfi:read></item>
<item>
<title xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="text"><![CDATA[文化传承视角下馆藏文物多粒度知识组织研究]]></title>
<link><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202208010&flag=1]]></link>
<description xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="html"><![CDATA[馆藏文物作为文化传承的重要载体，在文化保护和文化利用中发挥着不可替代的作用。随着数字化技术的不断发展，需要对馆藏文物知识进行有效组织，以满足用户通过数字化手段获取馆藏文物知识的需求。通过构建馆藏文物多粒度知识体系，从中粒度以及细粒度层面设计馆藏文物知识组织方法，并以馆藏文物的典型代表“后母戊”青铜方鼎为例进行实例研究。研究发现，馆藏文物多粒度知识体系对明确馆藏文物知识库分类管理机制、建立馆藏文物知识体系开放共享机制、完善馆藏文物知识产权保护机制、促进馆藏文物软硬件协同可持续发展具有重要的理论意义和现实启示。]]></description>
<pubDate>2022/9/8 0:00:00</pubDate>
<category><![CDATA[知识组织]]></category>
<author><![CDATA[李迎迎，孙玉琦]]></author>
<guid><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202208010&flag=1]]></guid><cfi:id>63</cfi:id><cfi:read>true</cfi:read></item>
<item>
<title xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="text"><![CDATA[非遗数字媒体资源本体模型构建研究]]></title>
<link><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202206004&flag=1]]></link>
<description xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="html"><![CDATA[研究旨在利用细粒度、结构化的方式将非遗数字媒体资源组织起来，建立“数字媒体-非遗活动-非遗人物-新闻资源”之间的联系，实现非遗信息资源深层次知识挖掘与共享，为非遗信息的传播与演化研究提供参考。本文首先深入阐释非遗数字媒体资源概念与特点，并在借鉴和发展书目描述框架基础上，构建非遗数字媒体资源本体组织模型；进而以2021年内有关南京剪纸的数字媒体资源作为实证对象，进行非遗数字媒体资源语义化组织实验研究。研究结果显示，该模型通过揭示非遗数字媒体资源的概念、属性及其语义关系，实现非遗数字媒体资源的知识发现。]]></description>
<pubDate>2022/7/29 0:00:00</pubDate>
<category><![CDATA[知识组织]]></category>
<author><![CDATA[朱佳慧，常娥]]></author>
<guid><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202206004&flag=1]]></guid><cfi:id>62</cfi:id><cfi:read>true</cfi:read></item>
<item>
<title xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="text"><![CDATA[标准文献知识图谱构建与应用研究]]></title>
<link><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202206005&flag=1]]></link>
<description xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="html"><![CDATA[促进标准文献知识的开发和利用，需要研究标准文献的知识组织模式和方法，推动标准数字化转型。本文通过分析标准文献的结构特征，构建标准文献的本体框架，涵盖标准文献中共性要素的概念和关系；并通过XML标准标签集拓展，构建适用于我国标准文献结构的标准标签集，实现标准文献机器可读和知识抽取；进而借助知识图谱构建技术实现标准文献知识图谱构建，并以实例挖掘标准文献知识图谱的应用价值。本研究聚焦标准文献，提出标准文献知识图谱构建方法，实现标准知识的交叉关联和共享重用，助力标准文献知识服务和智能应用。]]></description>
<pubDate>2022/7/29 0:00:00</pubDate>
<category><![CDATA[知识组织]]></category>
<author><![CDATA[杨跃翔，涂新雨，刘文玲]]></author>
<guid><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202206005&flag=1]]></guid><cfi:id>61</cfi:id><cfi:read>true</cfi:read></item>
<item>
<title xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="text"><![CDATA[基于知识图谱的中国近代史知识问答系统构建研究]]></title>
<link><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202206006&flag=1]]></link>
<description xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="html"><![CDATA[历史文献内容通常以线性文本的形式供用户浏览阅读，但当用户意在获取非线性的碎片化信息时，由于普通搜索引擎缺乏理解用户检索意图，且传统的信息组织方式也无法对历史知识元素进行细粒度的语义关联，因而无法完成意图理解式的智能搜索，故本文拟搭建基于知识图谱的中国近代史知识问答系统，以打破传统信息获取方式的局限性。首先从多个维度搭建中国近代史本体模型，并通过知识获取、知识抽取、知识融合、知识存储等方式完成知识图谱的实例构建，然后在此基础上遵循MVC模式三层架构设计实现了一个基于知识图谱的前后端分离的中国近代史知识问答系统，最后优化了知识问答系统中的语句解析任务，并对问答系统的性能进行测试，测试结果取得较好效果，表明该系统能够较为准确地回复自然语言提问。]]></description>
<pubDate>2022/7/29 0:00:00</pubDate>
<category><![CDATA[知识组织]]></category>
<author><![CDATA[赵浩宇，陈登建，曾桢，张虹雨]]></author>
<guid><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202206006&flag=1]]></guid><cfi:id>60</cfi:id><cfi:read>true</cfi:read></item>
<item>
<title xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="text"><![CDATA[艺术品唯一数字身份识别码初探]]></title>
<link><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202206007&flag=1]]></link>
<description xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="html"><![CDATA[艺术品数字身份识别码是艺术品信息管理的重要基础设施。虽然已有很多成熟的全球身份识别码实践，但是艺术品的特殊性依然要求一个专门的身份识别系统。本文在检视已有身份识别码相关标准、分析艺术品特点及其特殊信息需求的基础上，认为去中心化的身份识别码是艺术品身份管理的方向，并为艺术品唯一数字身份识别码的建设提出建议。]]></description>
<pubDate>2022/7/29 0:00:00</pubDate>
<category><![CDATA[知识组织]]></category>
<author><![CDATA[张劼圻，蒋菁]]></author>
<guid><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202206007&flag=1]]></guid><cfi:id>59</cfi:id><cfi:read>true</cfi:read></item>
<item>
<title xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="text"><![CDATA[全景式多路径知识图谱构建研究——以水稻粒型基因领域为例]]></title>
<link><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202204005&flag=1]]></link>
<description xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="html"><![CDATA[本文基于通用数据资源（科技文献、科研活动等）和专业领域知识资源（如组学科研数据），以水稻粒型基因领域为例，探索具有一定普适性，能兼顾知识覆盖广度和深度（全景式），并可充分继承整合多源异构数据和知识（多路径）的领域知识图谱构建方法。首先，继承复用权威学术论文中专家先验知识和多种领域本体，自顶向下设计构建全景式水稻粒型基因知识图谱模式层的本体模型；其次，通过图数据抽取、结构化及半结构化转换映射和非结构化文本抽取等多路径实现图谱数据实例填充，并基于数据挖掘发现的新实体及其语义关系，进行自底向上的本体模型迭代完善；再次，通过实体消歧、实体链接等实现多源知识关联融合，并基于Neo4j数据库实现图谱数据持久化存储；最后，对领域知识图谱驱动下的典型知识关联与发现服务应用场景进行展望。实验结果表明，本文研究提出的全景式、多路径领域知识图谱构建方法，具有一定集成性和通用性，可为细分垂直领域的知识图谱构建提供参考。]]></description>
<pubDate>2022/5/31 0:00:00</pubDate>
<category><![CDATA[知识组织]]></category>
<author><![CDATA[曹雨晴，鲜国建，黄永文，陈博立，李娇，罗婷婷，孙坦]]></author>
<guid><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202204005&flag=1]]></guid><cfi:id>58</cfi:id><cfi:read>true</cfi:read></item>
<item>
<title xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="text"><![CDATA[基于文献的中国近代史知识图谱构建与实证研究]]></title>
<link><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202204006&flag=1]]></link>
<description xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="html"><![CDATA[历史文献资源的内容组织方式通常采用非结构化文本形式进行记录，缺点在于内容之间的系统性和语义性不足，在一定程度上阻碍历史文献资源的深层次利用和开发。因此本文提出中国近代史相关历史要素资源语义描述与知识组织的思路和方法，并基于这一思路构建中国近代史历史本体模型，在此基础上通过Flask框架开发前端平台，实现前端应用层服务，完成中国近代史知识图谱的实证研究。依托本体模型，通过对中国近代史知识图谱的实例构建，实现历史知识元之间的细粒度关联，完成知识图谱可视化展示和知识查询，方便学者和用户对相关资源的开发和利用，为进一步的深入研究提供参考。]]></description>
<pubDate>2022/5/31 0:00:00</pubDate>
<category><![CDATA[知识组织]]></category>
<author><![CDATA[曾桢，赵浩宇]]></author>
<guid><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202204006&flag=1]]></guid><cfi:id>57</cfi:id><cfi:read>true</cfi:read></item>
<item>
<title xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="text"><![CDATA[基于学术论文全文内容的特定领域算法实体抽取研究]]></title>
<link><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202203002&flag=1]]></link>
<description xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="html"><![CDATA[对学术论文中的算法实体进行研究，能够促进深入了解算法对科学研究的作用，而从全文数据中抽取算法实体是相关研究的基础。学术论文全文内容中算法实体的抽取可以看作一种特殊的命名实体识别。本文通过人工识别的方法，从4 641篇论文中抽取出977种算法实体并构建算法实体词列表，以此为基础构建标注语料，训练算法实体自动抽取模型，在剩余语料上抽取得到221种新算法实体，并将自动抽取结果与人工抽取结果进行整合得到全部算法实体1 198种。研究结果表明：人工抽取法的结果能够为自动抽取法构建一定数量的标注语料，所构建的算法实体自动抽取模型能够有效地抽取出人工方法中遗漏的新算法实体，同时还能够抽取出已有算法实体的全新表达形式，进一步对人工抽取结果进行扩充和完善。]]></description>
<pubDate>2022/4/29 0:00:00</pubDate>
<category><![CDATA[知识组织]]></category>
<author><![CDATA[丁睿祎，王玉琢，章成志]]></author>
<guid><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202203002&flag=1]]></guid><cfi:id>56</cfi:id><cfi:read>true</cfi:read></item>
<item>
<title xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="text"><![CDATA[图像数据库元数据元素集调查研究和改进建议]]></title>
<link><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202203003&flag=1]]></link>
<description xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="html"><![CDATA[数字图像是数字信息资源的重要组成部分，但又不同于一般的信息资源。数字图像的组织需要专门的元数据标准。本文首先通过文献调研归纳并总结国内外数字图像元数据的研究现状；然后选择不同类型的图像数据库调查分析其图像的元数据元素，并将数据库内图像元素与数字图像相关的元数据标准进行对照分析；最后在理论分析和实践调查的基础上提出图像数据库元数据元素集的改进建议，具体包括17个元数据元素和11个元素修饰词，以期进一步完善图像数据库元数据在实践中的应用。]]></description>
<pubDate>2022/4/29 0:00:00</pubDate>
<category><![CDATA[知识组织]]></category>
<author><![CDATA[王荣群，李婷，魏蕊]]></author>
<guid><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202203003&flag=1]]></guid><cfi:id>55</cfi:id><cfi:read>true</cfi:read></item>
<item>
<title xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="text"><![CDATA[关联数据在知识库中应用的研究综述]]></title>
<link><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202203004&flag=1]]></link>
<description xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="html"><![CDATA[近年来关联数据在知识库中得到广泛应用。本文对关联数据在知识库中的研究现状进行系统分析和梳理，并总结关联数据在知识库的知识源、可视化和语义化3个方面的重点应用，探讨关联数据应如何更好地促进知识库的建设以满足用户的知识需求，进而指出关联数据在知识库的诸多领域皆有研究，但相关项目未能充分发挥关联数据的特点，存在过度依赖叙词表、忽视学科交叉等问题，后续研究需要在构建理念、知识集关联、知识领域融合和构建目标方面增加关注度。]]></description>
<pubDate>2022/4/29 0:00:00</pubDate>
<category><![CDATA[知识组织]]></category>
<author><![CDATA[尚渡新，袁润，夏翠娟，刘桂锋]]></author>
<guid><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202203004&flag=1]]></guid><cfi:id>54</cfi:id><cfi:read>true</cfi:read></item>
<item>
<title xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="text"><![CDATA[科技文献算法嵌套实体识别]]></title>
<link><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202202002&flag=1]]></link>
<description xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="html"><![CDATA[本文探讨了科技文献中算法实体的自动识别研究，着重研究嵌套型算法实体的识别优化问题。首先通过远程监督学习的方式构建算法实体训练语料，再引入数据增强技术扩充语料规模，最后应用BartNER模型实现科技文献中嵌套算法实体的自动识别。实验结果显示，在引用数据增强技术的基础上BartNER模型取得了76.66%的F1值，证明该方法对嵌套算法实体识别的有效性，同时证明数据增强策略能够有效提升嵌套算法实体的识别效果。]]></description>
<pubDate>2022/4/10 0:00:00</pubDate>
<category><![CDATA[知识组织]]></category>
<author><![CDATA[刘齐凯，李鹏程，陆伟，程齐凯]]></author>
<guid><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202202002&flag=1]]></guid><cfi:id>53</cfi:id><cfi:read>true</cfi:read></item>
<item>
<title xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="text"><![CDATA[基于情感词典的引文文本情感识别研究]]></title>
<link><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202202003&flag=1]]></link>
<description xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="html"><![CDATA[基于情感分析的引证行为研究通过揭示科研论文引用情感的普遍规律，进而探究引证行为的规律。本研究以OpinionFinder英文情感词典为基础，借助SO-PMI算法计算引文文本中词语的点互信息值来判断词语之间的语义相似度，从而构建了优化的引文领域情感词典。本研究从PLOS ONE期刊数据库收集了信息检索领域1?045篇文献的65?976处引用进行实证分析。结果表明，这些引用中有84.02%为中性引用，13.11%为正向引用，2.87%为负向引用。本研究可以为其他引文领域情感词典的构建，以及在更大规模引文数据中的应用提供借鉴。]]></description>
<pubDate>2022/4/10 0:00:00</pubDate>
<category><![CDATA[知识组织]]></category>
<author><![CDATA[左任衔，唐振华，黄晓，吴江]]></author>
<guid><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202202003&flag=1]]></guid><cfi:id>52</cfi:id><cfi:read>true</cfi:read></item>
<item>
<title xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="text"><![CDATA[基于BERT-MLDFA的内容相近类目自动分类研究——以《中图法》E271和E712.51为例]]></title>
<link><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202202004&flag=1]]></link>
<description xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="html"><![CDATA[针对《中图法》中具有关联度大、区分度小等特点的内容相近类目，探讨利用深度学习来提升分类效果的方法。本文构建BERT-MLDFA模型，即通过多层级注意力机制对BERT不同层参数进行动态融合，并在任务数据集上预训练，进而以《中图法》中E271和E712.51作为典型内容相近类目进行自动分类实验。结果表明：本文方法的Macro_F1值达到0.987，相较于经典机器学习方法提升2.4%，而且该方法可以捕捉内容相近类目文本之间的细微语义差别，能够较好地应用于《中图法》以及其他内容相近类目分类，具有较强普适性。]]></description>
<pubDate>2022/4/10 0:00:00</pubDate>
<category><![CDATA[知识组织]]></category>
<author><![CDATA[李湘东，石健，孙倩茹，贺超城]]></author>
<guid><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202202004&flag=1]]></guid><cfi:id>51</cfi:id><cfi:read>true</cfi:read></item>
<item>
<title xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="text"><![CDATA[基于改进LDA模型的铁路领域主题发现研究]]></title>
<link><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202202005&flag=1]]></link>
<description xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="html"><![CDATA[高效挖掘海量铁路领域科研成果数据中蕴含的主要内容是铁路领域科研人员在大数据时代亟待解决的重要问题。LDA模型是用于主题发现的主流方法，但在面向多单词短语居多的铁路领域研究文献时存在使用受限的问题，因此本文提出一种LDA模型的改进算法：一方面在构建主题模型前，对文本作预处理时抽取语料中的名词短语、动词短语、名词和动词；另一方面在主题模型构建完成后，融合TextRank算法与PMI算法得出关键词组块，并以此替换LDA主题识别结果中的主题词，进一步丰富主题的语义。最后，以铁路领域“牵引供电系统”为例开展实证研究。结果表明，本文提出的改进LDA模型有助于提升铁路领域主题发现结果的可解释性与可识别性，可以为后续铁路领域科研管理中知识服务的实现提供有效的方法支持。]]></description>
<pubDate>2022/4/10 0:00:00</pubDate>
<category><![CDATA[知识组织]]></category>
<author><![CDATA[龙艺璇，安源，王东晋，翟夏普，伊惠芳]]></author>
<guid><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202202005&flag=1]]></guid><cfi:id>50</cfi:id><cfi:read>true</cfi:read></item>
<item>
<title xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="text"><![CDATA[外文数据库英译中文作者姓名消歧实践]]></title>
<link><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202202006&flag=1]]></link>
<description xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="html"><![CDATA[针对外文数据库英译中文作者姓名存在多记录指向同一人或同记录指向不同人等情况，模拟人工排检法，整合多源数据、学术社交网络、知识百科及在线翻译网站等语料库，利用网页文档对象自动操作、正则表达式、短文本相似度计算等技术编制程序开展英译中文作者姓名消歧实践。结果表明，算法架构稳定有效、扩展性强，成功率得到从业人员认可，为数据预处理和清洗工作提供了新思路和新方法。]]></description>
<pubDate>2022/4/10 0:00:00</pubDate>
<category><![CDATA[知识组织]]></category>
<author><![CDATA[朱玉强，江涛，李翼飞]]></author>
<guid><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202202006&flag=1]]></guid><cfi:id>49</cfi:id><cfi:read>true</cfi:read></item>
<item>
<title xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="text"><![CDATA[音乐领域知识图谱构建框架研究]]></title>
<link><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202202007&flag=1]]></link>
<description xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="html"><![CDATA[音乐领域知识图谱是多模态知识图谱的典型应用，其建设难度远大于文本知识图谱，目前尚处于探索发展阶段。本文在研究国外现有音乐知识图谱的基础上对音乐知识图谱的特征进行分析，再按照知识获取、知识融合、知识检索与推理、可视化展示4个环节对音乐知识图谱的构建框架进行设计，并对推进我国音乐知识图谱的构建提出建议。]]></description>
<pubDate>2022/4/10 0:00:00</pubDate>
<category><![CDATA[知识组织]]></category>
<author><![CDATA[杨媛]]></author>
<guid><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202202007&flag=1]]></guid><cfi:id>48</cfi:id><cfi:read>true</cfi:read></item>
<item>
<title xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="text"><![CDATA[国际开放仓储目录整合研究与实践]]></title>
<link><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202201005&flag=1]]></link>
<description xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="html"><![CDATA[开放仓储目录是对开放仓储的描述说明和索引，是开放学术资源利用、发现、共享的基础。本文首先通过对OpenDOAR、ROAR、BASE等5个国际主流开放仓储目录的建设现状进行调研分析，发现在国际开放仓储目录建设方面，还存在仓储目录收录不够完整、目录元数据项不够丰富、目录更新时效性有待提高、揭示系统功能相对单一等不足。在此基础上，本文提出开放仓储目录元数据整合研究，包括元数据描述规范设计、基于OAI协议和ETL工具收割元数据，使用数据清洗工具OpenRefine对元数据进行“形式去重”和OAI-Identify获取结果的“内容去重”，并建立对多源异构仓储目录进行匹配融合的方法路径，形成数据内容更丰富、数量更加全面的全球开放仓储目录GOAR核心集和扩展集。最后从建立动态更新融合机制、常态化监控机制和目录发布系统三方面提出下一步研究方向。]]></description>
<pubDate>2022/3/8 0:00:00</pubDate>
<category><![CDATA[知识组织]]></category>
<author><![CDATA[张云玲，罗婷婷，赵瑞雪，鲜国建]]></author>
<guid><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202201005&flag=1]]></guid><cfi:id>47</cfi:id><cfi:read>true</cfi:read></item>
<item>
<title xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="text"><![CDATA[数字人文视域下可移动文物时空数据模型构建研究]]></title>
<link><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202201006&flag=1]]></link>
<description xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="html"><![CDATA[时间和空间是可移动文物的基本维度，也是可移动文物数据的重要属性和内容。对可移动文物时空数据进行组织与管理，有利于促进可移动文物的研究与利用。针对可移动文物的时间与空间信息特征，在对可移动文物进行时空变化类型和驱动因素分析的基础上，基于数字人文的方法与技术，提出了面向可移动文物的时空数据模型，并将其应用于绘画类可移动文物。基于该模型可以有效地组织与管理绘画类文物的时空信息，表达绘画类文物的时空演变过程，包括与绘画类文物时空变化相关的关键人物与驱动事件，对可移动文物的保护与发展具有一定的意义。]]></description>
<pubDate>2022/3/8 0:00:00</pubDate>
<category><![CDATA[知识组织]]></category>
<author><![CDATA[高劲松，杨慧娟，付家炜，张强]]></author>
<guid><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202201006&flag=1]]></guid><cfi:id>46</cfi:id><cfi:read>true</cfi:read></item>
<item>
<title xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="text"><![CDATA[《中国图书馆分类法》类目注释问题探讨]]></title>
<link><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202201007&flag=1]]></link>
<description xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="html"><![CDATA[类目注释是《中国图书馆分类法》类目体系的重要组成部分。类目注释是否合理、恰当、科学、实用，都直接影响其功能作用的发挥。本文分别对3D打印知识、项目管理知识、同类书排列方法3个类目注释方面的问题进行分析，并提出修改建议，希望促进《中国图书馆分类法》进一步修订，强化类目注释功能，更好发挥其工具作用。]]></description>
<pubDate>2022/3/8 0:00:00</pubDate>
<category><![CDATA[知识组织]]></category>
<author><![CDATA[李清，侯荣理，张馨]]></author>
<guid><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202201007&flag=1]]></guid><cfi:id>45</cfi:id><cfi:read>true</cfi:read></item>
<item>
<title xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="text"><![CDATA[德国政府开放数据的元数据标准及应用]]></title>
<link><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202212001&flag=1]]></link>
<description xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="html"><![CDATA[德国致力于成为世界上领先的开放数据国家，通过开放数据促进创新发展，尤其是在2021年密集出台了开放数据的战略、行动计划和法律，促使元数据标准建设呈现出新的特点和发展趋势。采用网络调查和文献分析方法，介绍德国元数据标准DCAT-AP.de的主要内容和应用情况，提炼可供借鉴的经验和做法。对我国而言，应在元数据标准的政策和法律支持、数据治理和组织保障、本土化与国际化的有机结合等方面借鉴其先进经验。]]></description>
<pubDate>2023/1/3 8:45:04</pubDate>
<category><![CDATA[知识组织]]></category>
<author><![CDATA[翟军，毕智航，董可新，沈立新]]></author>
<guid><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202212001&flag=1]]></guid><cfi:id>44</cfi:id><cfi:read>true</cfi:read></item>
<item>
<title xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="text"><![CDATA[科学元数据标准的现状、特点与改进建议]]></title>
<link><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202212002&flag=1]]></link>
<description xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="html"><![CDATA[通过网络调查和对比分析，发现现有科学元数据标准类型丰富多样，涉及领域广泛；不同标准所含元素异中有同；标准之间通过元数据文件格式、映射关系实现对数据共享的支持。进而分析归纳出以下特点：科学元数据标准多面向以定量研究为主的学科领域，且多局限于科学研究或数据管理的某一阶段，所含元素差异明显，在实际应用中多通过开发衍生标准或元素复用扩宽适用范围。经研究，在科学元数据标准开发构建过程中，科学元数据标准应从开放科学建设、数据共享实际需求、科学研究整体性等多个角度综合考虑进行设计和实践应用。]]></description>
<pubDate>2023/1/3 8:45:04</pubDate>
<category><![CDATA[知识组织]]></category>
<author><![CDATA[邱春艳，陈可睿]]></author>
<guid><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202212002&flag=1]]></guid><cfi:id>43</cfi:id><cfi:read>true</cfi:read></item>
<item>
<title xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="text"><![CDATA[基于深度学习的《方志物产》用途实体自动识别模型构建与应用]]></title>
<link><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202212003&flag=1]]></link>
<description xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="html"><![CDATA[以特色馆藏文献《方志物产》为研究语料，基于人工标注语料，运用Bi-LSTM、Bi-LSTM-CRF、BERT、Siku-BERT等4种深度学习模型开展实验，以精确率P、召回率R、调和平均数F作为测试指标，对模型的识别性能进行对比分析，促进物产知识的挖掘和利用。实验结果显示：相较于基于CRF的模型，4种深度学习模型的整体性能取得明显提升；Bi-LSTM、Bi-LSTM-CRF、BERT、Siku-BERT的最好R值分别为74.80%、78.05%、88.62%、89.74%；BERT、Siku-BERT注意力机制类深度学习模型的识别效果优于Bi-LSTM、Bi-LSTM-CRF循环类深度学习模型。由于方志类古籍文本结构复杂多样、人工标注精度存在误差、语料规模较小等因素，自动识别模型的实体抽取性能仍有较大的优化空间，但深度学习模型在方志类古籍的内容挖掘中表现出一定的优越性，且不同语料间预训练模型的迁移应用具有可行性。]]></description>
<pubDate>2023/1/3 8:45:05</pubDate>
<category><![CDATA[知识组织]]></category>
<author><![CDATA[李娜]]></author>
<guid><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202212003&flag=1]]></guid><cfi:id>42</cfi:id><cfi:read>true</cfi:read></item>
<item>
<title xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="text"><![CDATA[名人年谱资源的知识图谱构建——以徐朔方《晚明曲家年谱》为例]]></title>
<link><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202212004&flag=1]]></link>
<description xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="html"><![CDATA[以数字人文的研究范式与知识图谱工具相结合，实现名人群体文化的深度挖掘与展示，将传统名人年谱资源转变为共享性的立体数字资源。以徐朔方《晚明曲家年谱》作为研究素材，借助Protégé工具构建晚明曲家年谱本体，结合Neo4j图数据库完成年谱知识图谱的构建，以揭示当前传统年谱资源的数字研究价值与数字化再利用，提出未来传统名人年谱资源走向数字化与智能化深度研究的相关展望。]]></description>
<pubDate>2023/1/3 8:45:05</pubDate>
<category><![CDATA[知识组织]]></category>
<author><![CDATA[徐彤阳，黄映思]]></author>
<guid><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202212004&flag=1]]></guid><cfi:id>41</cfi:id><cfi:read>true</cfi:read></item>
<item>
<title xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="text"><![CDATA[基于语义谓词优化的疾病因果关系发现]]></title>
<link><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202211007&flag=1]]></link>
<description xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="html"><![CDATA[挖掘PubMed生物医学文献中蕴含的疾病因果关系，能够为疾病预防、诊疗提供参考，促使建立更好的疾病预防和治疗措施。本研究提出基于SemRep语义谓词优化的疾病因果关系抽取方法，构建了包含50个语义谓词的疾病因果关系语义谓词表，自动抽取259 434条疾病因果关系对，揭示疾病之间的单向因果关系和双向因果关系，并结合可视化图形直观呈现。最终验证了优化语义谓词的方法提升SemRep对疾病因果关系抽取效果的可行性，能够有效地从大规模生物医学文献中抽取疾病因果关系，也为其他领域的语义关系精准发现提供借鉴。]]></description>
<pubDate>2022/11/29 8:48:03</pubDate>
<category><![CDATA[知识组织]]></category>
<author><![CDATA[董鹏，李晓瑛，李军莲，唐小利]]></author>
<guid><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202211007&flag=1]]></guid><cfi:id>40</cfi:id><cfi:read>true</cfi:read></item>
<item>
<title xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="text"><![CDATA[多模态内容资源编目及知识表示研究]]></title>
<link><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202211008&flag=1]]></link>
<description xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="html"><![CDATA[在多模态信息资源体量快速增长的环境下，为更有效地对内容资源开展编目及知识表示工作，本文从多模态的角度出发，探讨在“实体-属性-关系”结构下多模态资源编目可行性，提出一种适用于多模态资源的编目框架M-RDA、梳理内容资源模态归一化方法。本文重点扩展编目框架中的多模态属性与关系类目，从4个模态维度出发，挖掘多种资源间的描述补充关系，在著录资源的同时对其模态特征及关系进行标注。此外，为实现编目规则下知识的组织和表达过程，本文从事件描述的原因、对象、地点、时间、人员、方法6个方面提出一种基于5W1H的多模态知识表示方法，实现多模态资源从标签获取、编目到知识表示的完整过程，为多模态资源的编目自动化提供理论参考和实践案例。]]></description>
<pubDate>2022/11/29 8:48:03</pubDate>
<category><![CDATA[知识组织]]></category>
<author><![CDATA[刘沛鹞，罗卓然，魏家泽，程齐凯]]></author>
<guid><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202211008&flag=1]]></guid><cfi:id>39</cfi:id><cfi:read>true</cfi:read></item>
<item>
<title xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="text"><![CDATA[基于表格检索和机器学习二阶段的文献表格相关文本自动识别]]></title>
<link><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202211009&flag=1]]></link>
<description xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="html"><![CDATA[学术文献中的表格以结构化的形式高度凝练地展示了文献中的核心知识。主流文献检索引擎中已逐步开始使用表格内容作为文字摘要的补充，以帮助科研人员快速掌握研究工作核心，提升科研工作效率。但是在仅展示表格而不提供表格的相关信息（对表格进行描述或解释的文本）的情况下，读者往往难以充分理解表格内容，阻碍文献阅读效率的进一步提升。本文提出一种基于表格检索和机器学习二阶段的表格相关文本识别方法，阶段一运用表格内容进行全文检索，获取潜在相关文本；阶段二构建机器学习模型，判断表格与潜在相关文本间的相关性，从而实现文献中表格相关文本的自动识别。以Text Retrieval Conference会议论文数据集为例，验证本文所提出的方法的有效性，证明该方法能够快速抽取文献中与图表相关的文本，为现有的论文图表抽取式摘要相关研究提供借鉴，对提高科研人员文献调研效率具有重要的现实意义。]]></description>
<pubDate>2022/11/29 8:48:04</pubDate>
<category><![CDATA[知识组织]]></category>
<author><![CDATA[黄佳妮，于丰畅]]></author>
<guid><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202211009&flag=1]]></guid><cfi:id>38</cfi:id><cfi:read>true</cfi:read></item>
<item>
<title xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="text"><![CDATA[词表语义类型框架与学科差异分析——以图书情报领域为例]]></title>
<link><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202309005&flag=1]]></link>
<description xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="html"><![CDATA[2019年科学出版社出版《图书馆·情报与文献学名词》，这是图书情报领域的科技名词集合，对该词表内容的语义类型分析可进一步为理解该领域的学科特征及知识体系提供新的视角。以《图书馆·情报与文献学名词》为分析对象，从词汇基本特征、词表语义类型框架构建和词表分类框架的学科差异方面进行分析，总结词表的词频特征和词汇组织形态的不足之处，并从语义角度对词表的分类体系进行重新认识和组织，通过与全学科词表分类体系的比较分析总结出优化图情学科词表的相关建议，如进一步体现词汇间的语义关联、补充完善具有学科交叉性质的词汇、全面推动宣传普及工作。]]></description>
<pubDate>2023/11/8 9:27:53</pubDate>
<category><![CDATA[知识组织]]></category>
<author><![CDATA[叶均玲，徐雷，刘瑜]]></author>
<guid><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202309005&flag=1]]></guid><cfi:id>37</cfi:id><cfi:read>true</cfi:read></item>
<item>
<title xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="text"><![CDATA[面向企业技术创新风险管理的本体构建及应用探索]]></title>
<link><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202309006&flag=1]]></link>
<description xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="html"><![CDATA[企业技术创新进程面临着大量未知风险，需要借助本体对多源异构的风险信息资源进行语义组织，构建本体知识库，提升企业对技术创新风险的智能化管理水平。面向企业技术创新风险管理领域，首先基于风险管理理论与概念抽取结果，采用七步法设计本体构建流程，复用ABC模型定义本体的8个超类与相应属性；然后运用Protégé工具实现本体可视化展示与实例创建，并结合领域专家意见开展本体评价工作；最后探索该本体模型在风险信息检索、风险量化评估和风险智能预测中的应用价值。面向企业技术创新风险管理的本体构建及应用探索一方面有利于提高该领域知识组织的语义化和智能化水平，另一方面可以为企业防控技术创新风险提供参考。]]></description>
<pubDate>2023/11/8 9:27:53</pubDate>
<category><![CDATA[知识组织]]></category>
<author><![CDATA[宋姗姗，钟永恒，刘佳，刘盼盼]]></author>
<guid><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202309006&flag=1]]></guid><cfi:id>36</cfi:id><cfi:read>true</cfi:read></item>
<item>
<title xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="text"><![CDATA[中国古代文人生平知识图谱构建与应用
——以李白和杜甫为例]]></title>
<link><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202308001&flag=1]]></link>
<description xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="html"><![CDATA[中国古代文人是传统文化的创造者和传播者，对他们的传记以及作品的内涵进行语义组织有助于提升历史文化的知识服务水平。采用本体与语义网技术对文人生平内容进行语义表示，重点关注文人的生平事件与作品内涵，从文人生平的时空维度出发，构建文人的生平事件以及作品信息之间的语义关联，以期通过可视化技术对文人生平经历以及思想演化特征进行呈现和分析。实例部分，以李白和杜甫为对象，基于构建的古代文人语义模型，对他们的生平和作品信息进行半自动标注，构建“李杜”生平知识图谱，并存入Neo4j图数据库，采用可视化技术展示和分析两位文人的人际关系以及不同时空背景下的生平事件、行迹、作品风格演变。关注文人生平的时空信息，将他们的生平事件与作品特征关联起来，从而直观地观察他们的生平经历与思想感情变化之间的联系，为传统人文研究助力。]]></description>
<pubDate>2023/10/16 10:54:04</pubDate>
<category><![CDATA[知识组织]]></category>
<author><![CDATA[沈雪莹，欧石燕，卢彤彤]]></author>
<guid><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202308001&flag=1]]></guid><cfi:id>35</cfi:id><cfi:read>true</cfi:read></item>
<item>
<title xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="text"><![CDATA[关联数据环境下我国海洋历史文献资源
知识组织研究]]></title>
<link><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202308002&flag=1]]></link>
<description xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="html"><![CDATA[海洋历史文献数量众多，繁杂分散，资源异构现象明显，现有文献资源建设方式难以实现资源间的深层关联与有效发掘利用。以海洋历史文献资源为对象，首先，在分析文献资源建设现状的基础上，总结出海洋历史文献资源建设中存在的理论认知、资源异构和知识关联等方面的问题。其次，以文本文献、历史舆图、金石文献、口述资料和音像资料五大模块，构建海洋历史文献资源体系，结合文献特点设计元数据结构，利用Protégé工具构建我国海洋历史文献资源本体模型。最后，以实例可视化形式，验证该本体模型的合理性，揭示海洋历史文献中时间、地点、人物和资源要素与特定事件的关联关系，为更好地开发利用海洋历史文献提供方案。]]></description>
<pubDate>2023/10/16 10:54:04</pubDate>
<category><![CDATA[知识组织]]></category>
<author><![CDATA[华林，冯安仪，谭雨琦]]></author>
<guid><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202308002&flag=1]]></guid><cfi:id>34</cfi:id><cfi:read>true</cfi:read></item>
<item>
<title xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="text"><![CDATA[数字人文视域下稷下人物知识重构与时空可视化研究]]></title>
<link><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202306001&flag=1]]></link>
<description xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="html"><![CDATA[数字人文视域下，以稷下人物事件梳理史实脉络，实现人物、时间、地点、事件、思想影响、研究记载等多元数据的重构和时空可视化，对于分析稷下人物的思想变化及历史意义至关重要。首先构建稷下人物元数据组织描述规范，形成统一的知识表述和组织规范；其次，利用事件抽取、思想分类等技术对研究文本进行细粒度处理，以时间叙事为主、事件叙事为辅进行知识重构；最后，利用地理信息系统可视化技术实现重构知识的时空可视化。通过对稷下人物规范化组织与重构，解决数字人文研究中历史人物数据碎片化和关联性不足等问题，并充分挖掘稷下人物隐性知识，丰富稷下人物知识发现视角与可视化维度，为数字人文知识发现与利用提供新思路。]]></description>
<pubDate>2023/7/3 13:51:49</pubDate>
<category><![CDATA[知识组织]]></category>
<author><![CDATA[张亚辉，白如江，张玉洁，耿振东，王志民]]></author>
<guid><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202306001&flag=1]]></guid><cfi:id>33</cfi:id><cfi:read>true</cfi:read></item>
<item>
<title xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="text"><![CDATA[应用深度学习的中文命名实体识别研究综述]]></title>
<link><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202305001&flag=1]]></link>
<description xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="html"><![CDATA[命名实体识别是自然语言处理领域的基础性工作，旨在从非结构化文本中识别出具有特定意义的实体并分类，在多种自然语言处理任务中发挥重要作用。由于中文命名实体没有明显的边界标记，且存在歧义和嵌套等问题，其识别过程比英语等其他语言要更为复杂。近年来，深度学习技术发展迅速，在中文命名实体识别中得到广泛应用，并已成为主流方法。系统梳理中文命名实体识别中深度学习技术的研究进展，重点从文本表示、特征编码、预测解码3个方面，对比分析代表性工作的关联性和关键技术，讨论研究中存在的问题、现有解决方案和未来的研究方向。]]></description>
<pubDate>2023/5/26 15:37:09</pubDate>
<category><![CDATA[知识组织]]></category>
<author><![CDATA[潘俊，李萌配，王贤明]]></author>
<guid><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202305001&flag=1]]></guid><cfi:id>32</cfi:id><cfi:read>true</cfi:read></item>
<item>
<title xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="text"><![CDATA[关联数据环境下基于价值链的新闻生产模型研究]]></title>
<link><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202305002&flag=1]]></link>
<description xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="html"><![CDATA[将新闻生产过程中的基本活动与波特价值链中的基本活动相对应，提出关联数据环境下基于价值链的新闻生产过程。在此基础上，结合新闻生产的一般规律，构建关联数据环境下基于价值链的新闻生产模型。该模型将关联数据技术嵌入新闻生产活动，实现新闻生产的高效率及个性化服务，对推动新闻生产流程优化升级以及对媒体的新闻生产实践活动有一定的指导意义。同时，为当今新闻媒体机构利用关联数据进行新闻生产活动指明方向，为新闻传媒行业更好地适应当代新闻生产的生态环境提供参考。]]></description>
<pubDate>2023/5/26 15:37:09</pubDate>
<category><![CDATA[知识组织]]></category>
<author><![CDATA[贾君枝，梅玥]]></author>
<guid><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202305002&flag=1]]></guid><cfi:id>31</cfi:id><cfi:read>true</cfi:read></item>
<item>
<title xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="text"><![CDATA[知识图谱在青铜器数字馆藏建设中的应用]]></title>
<link><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202304001&flag=1]]></link>
<description xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="html"><![CDATA[随着大数据时代的到来，以博物馆为代表的各大文化与科研机构展开文物数字化和数字馆藏建设的研究。青铜器是中国古代礼仪制度的重要实体表现，然而目前国内青铜器研究大多集中在学术文献与博物馆中，存在文物资源信息分散、数据质量不佳、数据关联性不强等问题。针对这些问题，对青铜器概念与术语进行分析，构建青铜器本体模型，将本体模型映射到图数据库中，利用Neo4j数据库构建青铜器知识图谱并探讨相关应用，实现对青铜器知识的关联与挖掘，从而促进知识共享与发现，为青铜器数字馆藏建设提供新思路。]]></description>
<pubDate>2023/5/8 16:42:52</pubDate>
<category><![CDATA[知识组织]]></category>
<author><![CDATA[胡汗林，邓三鸿]]></author>
<guid><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202304001&flag=1]]></guid><cfi:id>30</cfi:id><cfi:read>true</cfi:read></item>
<item>
<title xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="text"><![CDATA[面向融合出版技术的主题演化研究]]></title>
<link><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202304002&flag=1]]></link>
<description xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="html"><![CDATA[掌握融合出版领域前沿技术的应用现状与趋势，为融合出版领域的技术应用提供参考。选择2006—2022年融合出版领域的专利、新闻、公众号、学术论文数据，采用joiNLP算法提取关键短语，利用BERTopic模型进行主题提取，并基于all-MiniLM-L6-v2模型将主题向量化作为余弦相似度计算的依据，以分析2006—2022年融合出版技术主题与应用主题的强度演化与内容演化趋势，最终构建演化主路径。以多源数据为研究对象，揭示融合出版领域热点技术可归纳为区块链、人工智能、虚拟现实、增强现实，并指出未来融合出版将在元宇宙世界具有更广泛的应用空间。使用主题模型从文本语义层面提取技术主题，结果具有高准确性和强可解释性，对探究技术的演化规律与趋势具有创新意义。]]></description>
<pubDate>2023/5/8 16:42:53</pubDate>
<category><![CDATA[知识组织]]></category>
<author><![CDATA[曾江峰，黄泳潼，陈静怡，冯昌扬]]></author>
<guid><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202304002&flag=1]]></guid><cfi:id>29</cfi:id><cfi:read>true</cfi:read></item>
<item>
<title xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="text"><![CDATA[生物医学领域多源文献数据学科映射方法优化研究]]></title>
<link><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202303001&flag=1]]></link>
<description xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="html"><![CDATA[针对生物医学领域多源文献数据分类体系不一致、学科归属判别困难的问题，在分析国内外主流文献分类体系内容结构与已有映射方法优缺点的基础上，制定生物医学领域分类体系映射规则，提出集语义自动匹配、文献分类数据验证、人工审核于一体的融合映射方法。最终分别建立国际三大分类体系Web of Science、Scopus、FOR中生物医学类目与教育部《研究生教育学科专业目录（2022年）》相关类目的语义映射关系，开展用于肿瘤专题文献篇级分类的国内外学科体系映射实践。研究成果能够促进国际学术成果的集中检索、分类组织、统计评价等科研管理与学术分析工作，并为我国学科专业目录调整、人才培养、科研布局等提供决策依据与信息支撑。]]></description>
<pubDate>2023/4/25 13:07:07</pubDate>
<category><![CDATA[知识组织]]></category>
<author><![CDATA[李晓瑛，刘懿，李爱花，杨雪梅，唐小利]]></author>
<guid><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202303001&flag=1]]></guid><cfi:id>28</cfi:id><cfi:read>true</cfi:read></item>
<item>
<title xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="text"><![CDATA[地理学新发展背景下《中国分类主题词表》地理学类目调整新论]]></title>
<link><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202302004&flag=1]]></link>
<description xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="html"><![CDATA[《中分表》作为我国规模最大的分类-主题一体化标引工具，在学科知识的组织和传播方面发挥了重要作用。然而，随着地理学的快速发展，现有《中分表》地理学类目存在一些知识更新不及时、类目设置不科学的问题。本研究通过分析地理学的最新发展，结合《中分表》现有地理学类目中存在逻辑层级不清、知识点涵盖不完整、内容分布过于分散的现状，提出将地理学类重新整合为综合地理学、自然地理学、人文地理学、信息地理学4个二级学科，并对细分学科进行合并整理以避免词表过于细碎冗长。新的分类法将分散在各相关学科的类目整合归类到K9类目下，并通过参见、互见的方式保留地理学与各学科之间的联系，同时添加一些新涌现的专业词汇保证主题词的时效性和科学性。本研究有助于提高图书编目和排架的工作效率、改善读者地理学文献的查阅体验，并对地理学知识的交流传播产生一定促进作用。]]></description>
<pubDate>2023/3/21 14:44:56</pubDate>
<category><![CDATA[知识组织]]></category>
<author><![CDATA[谢庆恒]]></author>
<guid><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202302004&flag=1]]></guid><cfi:id>27</cfi:id><cfi:read>true</cfi:read></item>
<item>
<title xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="text"><![CDATA[图书馆资源发现系统书目关系揭示现状与提升策略探究]]></title>
<link><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202302005&flag=1]]></link>
<description xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="html"><![CDATA[本文以图书馆资源发现系统相关需求和支持现状为出发点，旨在梳理书目关系，明确书目关系在书目记录中的表达方法，进而提出资源发现系统支持书目关系的提升策略，包括提升馆员相关意识、优化MARC数据、实施规范控制和完善发现系统功能等，以期改善底层书目数据，优化发现系统的呈现和组织。]]></description>
<pubDate>2023/3/21 14:44:57</pubDate>
<category><![CDATA[知识组织]]></category>
<author><![CDATA[韩晓荣，郭丽君]]></author>
<guid><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202302005&flag=1]]></guid><cfi:id>26</cfi:id><cfi:read>true</cfi:read></item>
<item>
<title xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="text"><![CDATA[GLAM领域资源描述参考模型及应用场景研究]]></title>
<link><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202301001&flag=1]]></link>
<description xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="html"><![CDATA[规范描述、开放共享人类文化遗产信息资源是语义网时代GLAM的重要使命。资源描述参考模型是信息资源语义化、关联化的底层逻辑。面对GLAM领域不同应用场景的众多模型，研究典型模型的内容与特点，对人类文化遗产信息资源的知识融合、本体构建与映射、知识发现与服务创新等有重要意义。本文通过整理研究CIDOC CRM、RiC-CM、IFLA LRM、EDM和CDWA等5种模型的类别、属性、关系，对比分析各模型语义揭示的应用过程，总结资源描述应用场景的适用特点，挖掘资源描述参考模型及应用场景研究的应用价值，为文化遗产领域知识组织本体构建提供参考。]]></description>
<pubDate>2023/3/20 11:06:22</pubDate>
<category><![CDATA[知识组织]]></category>
<author><![CDATA[陈人语]]></author>
<guid><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202301001&flag=1]]></guid><cfi:id>25</cfi:id><cfi:read>true</cfi:read></item>
<item>
<title xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="text"><![CDATA[非英语国家如何应对国际编目体系转型——以法国为例]]></title>
<link><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202301002&flag=1]]></link>
<description xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="html"><![CDATA[国际编目体系的转型以IFLA-LRM概念模型、新版RDA内容规则和BIBFRAME书目格式为代表。梳理现有研究成果发现，面对变革，法国“尽可能融入，但强调本国特色”的立场值得进一步探究。法国应对国际编目体系转型的策略主要有：以EURIG为发声平台，推出书目转换项目及相关配套项目，开发RDA-FR和新一代MARC，不断优化升级关联数据集data.bnf.fr。法国的应对策略对我国融入国际编目新浪潮带来了启示：在顺应国际化的前提下弘扬中国特色，提升国际话语权；建立权威机构，统一组织培训；分阶段、分步骤推进新标准，注重系统性、稳定性和实效性；加强数据关联，整合数字文化资源。]]></description>
<pubDate>2023/3/20 11:06:22</pubDate>
<category><![CDATA[知识组织]]></category>
<author><![CDATA[查璐]]></author>
<guid><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202301002&flag=1]]></guid><cfi:id>24</cfi:id><cfi:read>true</cfi:read></item>
<item>
<title xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="text"><![CDATA[AIGC治理的研究进展与发展趋势]]></title>
<link><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202311003&flag=1]]></link>
<description xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="html"><![CDATA[对国内外人工智能生成内容（AIGC）的治理研究进行全面梳理，发现AIGC治理的研究热点和问题，明确未来的发展方向，为新的AI环境下AIGC治理策略的变革和提升提供指导。通过对国内外现有研究进行详细分析，从技术治理、法律治理、伦理治理和多主体协同治理等多个维度，探讨AIGC带来的新的治理要求，以及如何建立多元主体治理体系来应对。首先，AIGC的出现使信息的复杂性和隐蔽性增强，需要通过先进的AI模型和严格的质量管理制度来确保生成的内容在伦理上是可接受的，符合社会和个体的价值观和道德标准。其次，在法律方面关注版权、隐私、虚假信息以及算法歧视等多个法律问题，预见、研究并制定相关的法规。再次，在技术治理方面需要重视算法透明度和可解释性、数据保护和隐私、技术的使用场景适配、用户指导等几个关键内容。最后，通过多主体协同治理让政府、行业和媒体等多方参与，结合技术手段和法律法规，共同形成灵活、高效的治理框架。总之，揭示AIGC治理研究的现状和趋势，提出一系列应对策略，为AIGC的治理提供指导。]]></description>
<pubDate>2023/12/21 10:47:49</pubDate>
<category><![CDATA[知识组织]]></category>
<author><![CDATA[邓胜利，汪璠]]></author>
<guid><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202311003&flag=1]]></guid><cfi:id>23</cfi:id><cfi:read>true</cfi:read></item>
<item>
<title xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="text"><![CDATA[国内自然语言处理领域数据集引用行为分析]]></title>
<link><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202311004&flag=1]]></link>
<description xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="html"><![CDATA[随着科学研究对数据的依赖性不断增强，分析国内自然语言处理领域内数据集的引用行为，有利于规范化数据集的构建和使用，推动国内自然语言处理领域的快速发展。选取《中文信息学报》2013—2022年的1 628篇论文为样本，通过全文本分析法，人工标注1 970条数据集引用信息，以研究文献对数据集的引用行为。研究发现：在国内自然语言处理领域研究中，引用他人数据集的论文数量逐渐增加，使用自建数据集的论文逐渐减少，并且引用数据集论文的篇均被引频次高于自建数据集论文；引用多个数据集的倾向较为明显，引用单个数据集的论文逐渐减少，并且引用2~3个数据集论文的篇均被引频次高于引用单个数据集的论文；数据集重用性较低，高被引数据集主要来源于评测。]]></description>
<pubDate>2023/12/21 10:47:49</pubDate>
<category><![CDATA[知识组织]]></category>
<author><![CDATA[徐琳宏，王凯达，张立杰]]></author>
<guid><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202311004&flag=1]]></guid><cfi:id>22</cfi:id><cfi:read>true</cfi:read></item>
<item>
<title xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="text"><![CDATA[馆藏家谱文献知识化开发：价值、主体与过程]]></title>
<link><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202311005&flag=1]]></link>
<description xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="html"><![CDATA[家谱作为记载家族世系繁衍和重要事迹的珍贵历史文献，不仅可以满足人们日益增长的家谱文化需求，还为传承和弘扬中华优秀传统文化提供可行路径。基于馆藏家谱文献资源开发问题，构建家谱文献知识化开发的“价值-主体-过程”三维分析框架，以河南省档案馆馆藏明代正统本《河南如堂黄氏宗谱》为例，重点探讨家谱文献知识化开发过程中的数据获取、本体构建、知识抽取、知识融合和资源可视化等问题，以期为家谱文献资源的深度开发提供新模式。]]></description>
<pubDate>2023/12/21 10:47:50</pubDate>
<category><![CDATA[知识组织]]></category>
<author><![CDATA[朱兰兰，霍婕，高玉婷]]></author>
<guid><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202311005&flag=1]]></guid><cfi:id>21</cfi:id><cfi:read>true</cfi:read></item>
<item>
<title xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="text"><![CDATA[文化遗产的数字叙事现象分析及应用建议]]></title>
<link><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202311006&flag=1]]></link>
<description xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="html"><![CDATA[在社会主义文化强国建设的关键时期，推动中华文明的创造性转化和创新性应用成为国家发展的主旋律，文化遗产的数字叙事可很好地契合上述发展要求与趋势。首先，在收集及分析已有应用案例的基础上，从虚拟全景漫游、实地+数字化、资源服务平台、游戏、虚拟数字人5个方面归纳文化遗产数字叙事的应用形式与特点。然后，总结并分析文化遗产数字叙事现象带来的影响与变化。最后，从叙事内容的组织与策划、叙述策略设计、叙事媒介选择、受众的情绪弧分析与内容调整4个方面，对文化遗产数字叙事作品的创建提出建议。]]></description>
<pubDate>2023/12/21 10:47:50</pubDate>
<category><![CDATA[知识组织]]></category>
<author><![CDATA[刘芳，吴振新]]></author>
<guid><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202311006&flag=1]]></guid><cfi:id>20</cfi:id><cfi:read>true</cfi:read></item>
<item>
<title xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="text"><![CDATA[NSTL科技文献资源分类体系构建研究]]></title>
<link><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202408001&flag=1]]></link>
<description xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="html"><![CDATA[相对科学的分类体系是实现科技文献资源学科特征有效揭示的重要依据。面向国家科技图书文献中心（National Science and Technology Library，NSTL）资源集成与知识服务的总体需求，通过主体及重点学科揭示、多体系融合、多维同位类设置、多学科列类、新兴学科类目扩展、综合性类目设置、双重语义编码等方法，编制可基本覆盖NSTL主体资源的NSTL科技文献分类体系，共包含61个基本大类，类目深度为4~5级，类目数达5 350个。同时建立与现用核心分类体系的映射关系，支撑资源分类数据规范处理、馆藏目录系统服务等方面的应用。该分类体系可支撑国家重点扶持产业资源保障分析与学科布局评估。]]></description>
<pubDate>2024/9/30 13:54:38</pubDate>
<category><![CDATA[知识组织]]></category>
<author><![CDATA[邓盼盼，李军莲，冀玉静，任慧玲，葛红梅]]></author>
<guid><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202408001&flag=1]]></guid><cfi:id>19</cfi:id><cfi:read>true</cfi:read></item>
<item>
<title xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="text"><![CDATA[面向在线健康社区UGC的医疗健康知识图谱构建研究——以小儿腹泻病为例]]></title>
<link><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202408002&flag=1]]></link>
<description xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="html"><![CDATA[构建面向在线健康社区用户生成内容（User Generated Content，UGC）数据的医疗健康知识图谱，探究基于用户潜在需求的健康知识抽取，对优化在线健康社区信息组织与检索，支撑在线健康社区知识服务创新具有重要意义。提出基于在线健康社区UGC数据的实体识别组合模型LDA-BERT-BiLSTM-CRF，首先利用LDA主题模型对在线健康社区UGC数据进行主题聚类分析从而提取实体类型，基于细分实体类型利用BERTBiLSTM-CRF模型进行命名实体识别；然后采用MC-BERT-CasRel模型抽取在线健康社区UGC数据中的重叠三元组，并通过SBERT模型实现实体对齐；最后利用Neo4j图数据库完成知识图谱的存储和可视化。以小儿腹泻病为例，基于所提方法最终构建包含939个实体和3 224个关系的小儿腹泻病知识图谱。与目前主流模型进行对比实验，结果表明，所采用的组合模型LDA-BERT-BiLSTM-CRF与关系抽取模型MC-BERT-CasRel较传统方法知识抽取更准确，实体分类也更具针对性。]]></description>
<pubDate>2024/9/30 13:54:39</pubDate>
<category><![CDATA[知识组织]]></category>
<author><![CDATA[孟秋晴，郑铭瑞，田玥璐，刘逸品，王琼弟]]></author>
<guid><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202408002&flag=1]]></guid><cfi:id>18</cfi:id><cfi:read>true</cfi:read></item>
<item>
<title xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="text"><![CDATA[基于Semantic Turkey的主题词表及本体构建应用研究]]></title>
<link><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202405004&flag=1]]></link>
<description xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="html"><![CDATA[基于Seman主题词表及本体是语义化知识管理系统的基础数据支撑，对领域知识的语义化组织及知识图谱的构建具有重要意义。在建设公共危机案例知识集成平台的过程中，采用开源软件Semantic Turkey开发主题词表及本体构建功能，并在此基础上实现规范数据录入、词表导航、知识映射等功能，从而支持进一步的语义检索和知识推理。构建的主题词表及本体模型基于语义网标准与技术，具有良好的规范性和互操作性。开源软件Semantic Turkey提供了功能完备的应用程序编程接口，与完全自主开发相比，降低了开发成本，缩短了开发时间，为语义化知识管理系统的开发工作提供新思路和参考依据。]]></description>
<pubDate>2024/6/14 14:40:53</pubDate>
<category><![CDATA[知识组织]]></category>
<author><![CDATA[姚晓娜，王思丽，张旺强]]></author>
<guid><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202405004&flag=1]]></guid><cfi:id>17</cfi:id><cfi:read>true</cfi:read></item>
<item>
<title xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="text"><![CDATA[基于社会资本理论的华侨华人知识图谱构建与应用]]></title>
<link><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202405005&flag=1]]></link>
<description xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="html"><![CDATA[华侨华人群体是推动我国现代化建设和民族复兴的重要力量。以社会资本理论为基础，提出华侨华人知识图谱的构建与应用方案，为面向华侨华人的知识服务提供数据支撑。首先，根据社会资本的来源，分析华侨华人领域的相关概念，进行华侨华人领域本体建模；然后，从华侨华人领域文献中抽取知识单元，使用Neo4j图数据库存储华侨华人领域知识；最后，从社会资本理论的3个维度出发，设计面向华侨华人知识图谱的语义检索和问答策略。基于社会资本来源所设计的华侨华人知识图谱，可揭示华侨华人知识间复杂多样的关系；基于社会资本理论3个维度设计的语义检索和智能问答系统，可以实现华侨华人领域知识的细粒度、多维度呈现。]]></description>
<pubDate>2024/6/14 14:40:53</pubDate>
<category><![CDATA[知识组织]]></category>
<author><![CDATA[洪宝惜，林泽斐]]></author>
<guid><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202405005&flag=1]]></guid><cfi:id>16</cfi:id><cfi:read>true</cfi:read></item>
<item>
<title xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="text"><![CDATA[基于生成式预训练语言模型的学者画像构建研究]]></title>
<link><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202403001&flag=1]]></link>
<description xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="html"><![CDATA[大数据时代，互联网中以多源异构、非结构化形式存在的学者信息在实体抽取时伴有属性混淆、长实体等问题，严重影响学者画像构建的精准度。与此同时，学者属性实体抽取模型作为学者画像构建过程中的关键模型，在实际应用方面还存在较高的技术门槛，这对学者画像的应用推广造成一定阻碍。为此，在开放资源的基础上，通过引导句建模、自回归生成方式、训练语料微调等构建一种基于生成式预训练语言模型的属性实体抽取框架，并从模型整体效果、实体类别抽取效果、主要影响因素实例分析、样例微调影响分析4个方面对该方法进行验证分析。与对比模型相比，所提出的方法在12类学者属性实体上均达到最优效果，其综合F1值为99.34%，不仅能够较好地识别区分相互混淆的属性实体，对“研究方向”这一典型长属性实体的抽取准确率还提升了6.11%，为学者画像的工程化应用提供了更快捷、有效的方法支撑。]]></description>
<pubDate>2024/4/12 8:08:04</pubDate>
<category><![CDATA[知识组织]]></category>
<author><![CDATA[柳涛，丁陈君，姜恩波，许睿，陈方]]></author>
<guid><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202403001&flag=1]]></guid><cfi:id>15</cfi:id><cfi:read>true</cfi:read></item>
<item>
<title xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="text"><![CDATA[融合情感语义与句法结构的中文开放域事理图谱构建研究]]></title>
<link><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202403002&flag=1]]></link>
<description xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="html"><![CDATA[为解决大规模开放域事理图谱构建过程中缺少标注数据以及事件类型未知导致的限定域事理图谱构建方法难以迁移的问题，利用规则匹配方法高效识别开放域文本中包含的多种事件逻辑关系，融合情感语义与句法结构信息分析提高事件抽取准确性，以更好完成事理图谱的构建任务。首先，总结并扩展因果、顺承、条件、转折等多种逻辑关系抽取模板，并基于规则模板、依存句法信息筛选逻辑关系事件句；其次，创新性地引入情感语义分析方法，在句法结构信息的基础上，通过捕获事件及事件间关系的情感语义精准识别事件类型，进而抽取事件论元；再次，计算语义相似度，进行事件融合，构建＜前序事件，事件逻辑关系，后序事件＞三元组，得到事件事理图谱，并进一步进行事件泛化以构建抽象事理图谱；最后，以事件发展较完整的“2022年猴痘事件”为数据源，通过实证分析证明开放域事理图谱构建方法可以实现不同类型事件的识别、事件间逻辑关系的揭露，其有效性、可行性得到验证。研究不仅弥补了现有事理图谱构建理论的不足，也为决策支持、事件发展预测等提供有力的数据支持。]]></description>
<pubDate>2024/4/12 8:08:05</pubDate>
<category><![CDATA[知识组织]]></category>
<author><![CDATA[赵又霖，林怡妮，石燕青]]></author>
<guid><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202403002&flag=1]]></guid><cfi:id>14</cfi:id><cfi:read>true</cfi:read></item>
<item>
<title xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="text"><![CDATA[基于多阶段分类的科研项目申请书结构功能识别]]></title>
<link><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202403003&flag=1]]></link>
<description xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="html"><![CDATA[科研项目申请书蕴含丰富的科学知识，被广泛用作科技情报分析的基础数据，其中重复检测、分析挖掘等智能处理工作需要在明晰申请书结构功能的前提下展开。因此，构建一种基于多阶段分类的科研项目申请书结构功能识别模型。首先，对申请书进行预处理，识别申请书的正文内容及其包含的多模态要素，并将文本段落规范化；之后，基于BiLSTM-Attention模型，依次区分申请书中的章节标题与正文文本，基于标题识别正文文本的一级功能，进而识别申请书的细粒度结构功能。实验结果显示，所提方法的准确率与召回率分别达到93.7%和93.1%，该方法能较好支撑科研项目申请书的结构化解析，也能为其他类型学术文本的结构功能识别提供参考。]]></description>
<pubDate>2024/4/12 8:08:05</pubDate>
<category><![CDATA[知识组织]]></category>
<author><![CDATA[林鑫，杜莹，罗宇]]></author>
<guid><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202403003&flag=1]]></guid><cfi:id>13</cfi:id><cfi:read>true</cfi:read></item>
<item>
<title xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="text"><![CDATA[文化遗产领域知识组织系统语义关联模型比较分析]]></title>
<link><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202411003&flag=1]]></link>
<description xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="html"><![CDATA[文化遗产领域的知识组织系统是用于描述、组织和管理文化遗产信息资源的语义工具，语义关联模型是知识组织系统语义化描述和关联化揭示领域知识的核心架构。通过对比艺术与建筑词表、中国图像志索引典、敦煌壁画主题词表及云冈学本体这4个文化遗产领域知识组织系统语义关联模型的主题领域及体量、顶层框架及语义关系体系，以及在知识组织系统中的应用情况，分析模型在规模和广度、复杂性和深度以及应用实践方面的特点和差异，揭示语义关联模型在知识组织系统中的实际作用，提出语义关联模型的优化路径，为文化遗产领域知识组织系统的构建及更新提供参考。]]></description>
<pubDate>2025/1/23 15:18:23</pubDate>
<category><![CDATA[知识组织]]></category>
<author><![CDATA[赵建润，肖珑]]></author>
<guid><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202411003&flag=1]]></guid><cfi:id>12</cfi:id><cfi:read>true</cfi:read></item>
<item>
<title xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="text"><![CDATA[方志书目提要语义化知识组织与知识发现研究]]></title>
<link><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202411004&flag=1]]></link>
<description xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="html"><![CDATA[方志书目提要具有丰富的内涵价值，可帮助用户更好地理解和利用方志资源。在深入分析方志书目提要内外部特征的基础上，提出方志书目提要语义化知识组织框架，以《江苏旧方志提要》为例，通过知识本体设计、关联数据生成、知识图谱构建等环节展开实证研究。通过对方志书目提要进行深度语义化知识组织，可进一步将蕴含其中的各类知识进行关联，发现更多隐含知识，将其“考镜源流，辨章学术”的重要作用揭示出来。研究旨在激活蕴藏在方志书目提要中的多维度知识，也为其他类型书目提要资料语义化知识组织提供借鉴，同时也丰富了我国数字人文研究的应用场景。]]></description>
<pubDate>2025/1/23 15:18:23</pubDate>
<category><![CDATA[知识组织]]></category>
<author><![CDATA[徐晨飞，唐佳林]]></author>
<guid><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202411004&flag=1]]></guid><cfi:id>11</cfi:id><cfi:read>true</cfi:read></item>
<item>
<title xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="text"><![CDATA[混合任务场景下基于大语言模型的动态检索增强生成]]></title>
<link><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202507003&flag=1]]></link>
<description xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="html"><![CDATA[针对大语言模型在多任务多语言场景下面临的跨领域知识整合效率不足与任务泛化能力受限的问题，提出了一种面向混合任务场景的动态检索式知识增强框架，以提升大语言模型的内容生成质量。其检索机制核心为一种基于强化学习的神经网络分类树模型，通过标签化树形结构，将异构知识库模块化映射至叶子节点，将最优知识库作为目标进行检索，并从中提取数据增强后的知识与模型结合，从而达到根据输入自适应地匹配最优外部知识的效果。实验设计从知识检索与增强生成两个维度展开：一方面在混合任务场景中评估检索精度；另一方面以日语文本摘要任务为例，在XL-Sum和WikiLingua两个公开数据集上进行性能提升的实证研究。实验结果表明，所提框架在24个数据集规模的混合任务场景下检索有效知识的准确率表现优秀，在摘要任务上的ROUGE指标相较于传统的检索增强方法有更显著的提升。所提出的框架具有较好的实用性和可扩展性，为大语言模型在混合任务场景下的适配提供了有效的解决方案。]]></description>
<pubDate>2025/11/10 15:35:50</pubDate>
<category><![CDATA[知识组织]]></category>
<author><![CDATA[余传明，李昊轩]]></author>
<guid><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202507003&flag=1]]></guid><cfi:id>10</cfi:id><cfi:read>true</cfi:read></item>
<item>
<title xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="text"><![CDATA[大语言模型驱动的图书馆书目检索系统研究——以“巴金主题文献展”策展任务为例]]></title>
<link><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202507004&flag=1]]></link>
<description xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="html"><![CDATA[面向传统书目检索语义理解不足、跨源整合困难与结果可用性有限等问题，提出一套以检索为主、内嵌语义扩展与检索增强的大语言模型驱动方案。方法上采用检索增强思维（RAT）规划检索指令并对接联机公共检索目录（OPAC）/馆藏接口，获取可验证的结构化书目信息，以“巴金主题文献展”为策展场景设计多角度检索任务，从专业读者视角开展实证评估。实验结果表明，该方案在复杂自然语言查询与多维需求处理中显著提升相关性、覆盖度与结构完整性，并在结果组织阶段通过语义扩展与重排提升策展工作的可行性。通过RAT进行语义扩展检索，基于RAT与OPAC联动的可实施流程，为生成式图书馆书目检索系统的设计与落地提供可复用的方法。]]></description>
<pubDate>2025/11/10 15:35:50</pubDate>
<category><![CDATA[知识组织]]></category>
<author><![CDATA[郭利敏，付雅明，刘悦]]></author>
<guid><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202507004&flag=1]]></guid><cfi:id>9</cfi:id><cfi:read>true</cfi:read></item>
<item>
<title xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="text"><![CDATA[大语言模型与知识图谱协同增强知识组织理论架构研究]]></title>
<link><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202505003&flag=1]]></link>
<description xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="html"><![CDATA[探究了大语言模型（Large Language Model，LLM）与知识图谱协同增强知识组织的有效结合模式，旨在提高知识组织的准确性与效率。依托LLM的自然语言处理与知识生成能力，以及知识图谱对结构化信息的表达和推理能力，提出一种协同增强的知识组织理论架构。首先，系统回顾现有知识图谱应用于知识语义组织的理论与实践发展，梳理LLM在科学知识抽取、实体对齐和图谱融合中的应用，论证知识图谱存储和检索的优化原理，调研LLM与知识图谱协同应用的典型项目。然后，在调研和归纳的基础上，针对知识组织具体操作环节，探究嵌入LLM的合理步骤，重构知识图谱实现知识组织的智能化流程，归纳总结图模协同增强知识组织的有效理论架构。研究发现，图模协同增强可以显著提升知识组织的精确度和可解释性，尤其是在跨领域、多源异构科学知识组织中，能够有效减少LLM的幻觉问题，并提高科学知识检索和问答的准确性与交互性。]]></description>
<pubDate>2025/7/24 16:25:35</pubDate>
<category><![CDATA[知识组织]]></category>
<author><![CDATA[张心源，肖浩宇，李白杨]]></author>
<guid><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202505003&flag=1]]></guid><cfi:id>8</cfi:id><cfi:read>true</cfi:read></item>
<item>
<title xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="text"><![CDATA[基于精细异质信息网络表示学习的文献推荐研究]]></title>
<link><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202505004&flag=1]]></link>
<description xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="html"><![CDATA[目前针对异质信息网络的文献推荐主要基于已有的文献间引用、共同作者、同期刊发表等信息构建文献之间的关联关系，没有从文献的研究问题、方法模型等研究人员更关心的文献细粒度内容角度构建文献间关系，不能将这些细粒度的关联关系融入文献推荐过程，从而影响最终的推荐效果。将文献的研究问题、方法模型两类细粒度标签加入学术信息网络，并提出了文献推荐模型PRM-FHIN，通过对异质信息网络表示学习方法HECO进行优化学习网络节点的结构向量，通过对SciBERT模型进行微调学习网络节点的内容向量，基于融合的内容向量和结构向量实现最终的文献推荐。从开放学术图谱中抽取2010—2020年计算机科学领域的185万篇论文作为实验数据，实验结果表明：优化后的HECO算法能更好地对网络节点进行嵌入式表示，在异质信息网络中融入研究问题和方法模型等细粒度标签可以丰富文献之间的语义信息，从而提高最终的文献推荐效果。]]></description>
<pubDate>2025/7/24 16:25:35</pubDate>
<category><![CDATA[知识组织]]></category>
<author><![CDATA[李琳娜，郭晓琪，张运良，王力，张晓丹]]></author>
<guid><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202505004&flag=1]]></guid><cfi:id>7</cfi:id><cfi:read>true</cfi:read></item>
<item>
<title xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="text"><![CDATA[NOMEN命名实体数据模型及其实施研究]]></title>
<link><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202505005&flag=1]]></link>
<description xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="html"><![CDATA[基于NOMEN实体的理论模型和实践路径研究，对于实现开放数据网络环境下名称数据的统一描述和语义集成具有重要意义。首先，分析实体及其命名区分建模的现状，针对现有NOMEN模型推广及实践工作进行系统调研；其次，探究NOMEN实体建模的理论基础，通过标准解读和对比分析等方法，全面而深入地阐释NOMEN实体数据模型，确保对实体、属性和关系的透彻理解；最后，通过案例分析探索在MARC和BIBFRAME中实施NOMEN实体的具体方案，并提供实际操作示例，直观展示如何将理论模型转化为实际应用。]]></description>
<pubDate>2025/7/24 16:25:35</pubDate>
<category><![CDATA[知识组织]]></category>
<author><![CDATA[陈辰，李佳伦，李香草，李春秋]]></author>
<guid><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202505005&flag=1]]></guid><cfi:id>6</cfi:id><cfi:read>true</cfi:read></item>
<item>
<title xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="text"><![CDATA[基于机器阅读理解的科技文献三元组抽取模型研究]]></title>
<link><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202504005&flag=1]]></link>
<description xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="html"><![CDATA[科技文献是推动科学研究和技术进步的重要资源，然而随着文献数量的激增，科研人员面临着从海量文献中快速获取关键信息的挑战。提出基于机器阅读理解的开放信息抽取模型MMOIE（Multi-AnswerMachine-Reading-Comprehension Open Information Extraction），用于高效提取科技文献中的三元组。该模型通过结合SIFRank+模型与ELMo预训练语言模型，精确计算关键词的关键性权重，进而筛选出包含至少一个关键词的事实三元组。实验结果表明，与ZORE、SpanOIE、MGD-GNN、TPOIE等方法相比，MMOIE模型在三元组抽取中的召回率达到64.78%，F1分数达到55.62%，显著提升了关键信息的提取效率和质量，有效捕捉了文献中的实体关系，为科研人员快速获取关键信息提供了有力支持。]]></description>
<pubDate>2025/6/17 16:29:45</pubDate>
<category><![CDATA[知识组织]]></category>
<author><![CDATA[王莉军，刘洢颖，郑明，李雪，王鑫月]]></author>
<guid><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202504005&flag=1]]></guid><cfi:id>5</cfi:id><cfi:read>true</cfi:read></item>
<item>
<title xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="text"><![CDATA[生物学领域知识组织网格初构]]></title>
<link><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202504006&flag=1]]></link>
<description xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="html"><![CDATA[参考美国国立医学图书馆编制的《医学主题词表》和国际农业生物科学中心（CABI）编制的《CABI叙词表》等国内外系统的顶层本体体系，结合《中国图书馆分类法》、国家标准《学科分类与代码》的学科分类体系，从生物学对象和过程两个维度，初步构建生物学领域顶层实体和属性的知识组织网格。知识组织网格以二维网格形式描述了生物学领域对象实体和语义属性类概念的学科分类，简明直观地反映了各概念的多学科属性，为《汉语主题词表》编研过程中的学科分类属性编制提供参考。此外，基于顶层实体和属性框架，知识组织网格能够为生物学领域主题概念提供直观的领域内学科分类判定，对概念遴选有参考意义。研究成果在《汉语主题词表（生物医学农业卷）》编制过程中得到应用，在其他方向上可根据需要进一步细化使用。]]></description>
<pubDate>2025/6/17 16:29:46</pubDate>
<category><![CDATA[知识组织]]></category>
<author><![CDATA[王江宁，卜翠萍，李文杰，纪力强，沈东婧，姚远，吴雯娜，常春]]></author>
<guid><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202504006&flag=1]]></guid><cfi:id>4</cfi:id><cfi:read>true</cfi:read></item>
<item>
<title xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="text"><![CDATA[融合图尔敏模型与大语言模型的社会科学循证知识库构建方法]]></title>
<link><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202510003&flag=1]]></link>
<description xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="html"><![CDATA[社会科学领域的循证研究面临文献数量快速增长及论证情境复杂的双重挑战，亟需智能、高效的证据处理方法。本研究提出一种融合图尔敏模型和大语言模型的社会科学循证知识库构建方法，旨在提升社会科学证据的处理效率及证据分析的智能化水平。首先，设计以论证为中心的信息抽取流程；其次，构建面向语义检索的多维度知识组织模型；最后，设计基于链式推理的智能循证服务流程，并以图书情报学为例，开发原型系统ToulminQA。实验评测表明，ToulminQA在论证要素抽取方面具有较高的准确性与可靠性，同时系统能够有效整合大量证据，形成逻辑清晰、具备实用价值的循证结论。本研究为社会科学领域提供了一种新的循证研究路径及具有参考价值的实践范例。]]></description>
<pubDate>2026/1/23 13:57:37</pubDate>
<category><![CDATA[知识组织]]></category>
<author><![CDATA[齐涵悦，杨颜僖，林泽斐]]></author>
<guid><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202510003&flag=1]]></guid><cfi:id>3</cfi:id><cfi:read>true</cfi:read></item>
<item>
<title xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="text"><![CDATA[基于改进图像多标签分类的古籍异体字部件识别研究]]></title>
<link><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202510004&flag=1]]></link>
<description xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="html"><![CDATA[针对古籍异体字多为图像存储，无法直接数字化检索的问题，本研究基于多标签分类的古籍异体字识别方法，构建ECA-HFF-DTA模型，包括增强型通道注意力（ECA）模块、多尺度特征融合分类头（HFFHead）和动态阈值调整（DTA）机制3个模块，自动识别其构成部件并生成多标签分类结果。实验表明，模型在独立测试集上的F1值达到0.578 3，较原始模型提升显著，可以实现基于部件查询异体字的应用功能。但模型对复杂多嵌套结构异体字的识别效果仍有待提高。ECA-HFF-DTA模型提升了古籍异体字部件识别效果，为大规模古籍文献异体字的智能化整理与检索提供思路。]]></description>
<pubDate>2026/1/23 13:57:37</pubDate>
<category><![CDATA[知识组织]]></category>
<author><![CDATA[郑澄璐，王昊，孟序阳，杨思敏]]></author>
<guid><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202510004&flag=1]]></guid><cfi:id>2</cfi:id><cfi:read>true</cfi:read></item>
<item>
<title xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="text"><![CDATA[基于“人在回路”的生成式人工智能在图书编目中的应用——以Kimi和DeepSeek技术适配性对比为例]]></title>
<link><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202510005&flag=1]]></link>
<description xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="html"><![CDATA[生成式人工智能为图书馆编目业务提供了新的技术路径，但其专业应用面临技术适配性挑战。本研究基于“人在回路”（HITL）机制设计了“基线测试-模型对比-定向优化”三阶段实验框架，系统评估了Kimi与DeepSeek两款国产大模型在西文图书MARC21编目中的表现。实验结果表明：在无专业干预条件下，两款模型原生能力存在显著差异（Kimi F1=7.41%，DeepSeek F1=51.30%）；经统一提示词引导后，DeepSeek（F1=83.00%）综合表现优异，显著优于Kimi（F1=63.50%）；进一步实施精细化提示工程后，DeepSeek（F1=95.16%）性能实现跃升。通过人类编目员的动态校验与反馈，生成式人工智能可突破初始技术限制，实现从通用对话到专业编目任务的适配。研究验证了“人在回路”机制在模型选型与性能优化中的有效性，提出了建立提示词知识库、实施字段分级管控等实践建议，为图书馆构建人机协同的智能编目体系提供了参考方案。]]></description>
<pubDate>2026/1/23 13:57:37</pubDate>
<category><![CDATA[知识组织]]></category>
<author><![CDATA[吴诺曼，赖伟，胡琳]]></author>
<guid><![CDATA[https://dlf.istic.ac.cn/dlf/ch/reader/view_abstract.aspx?file_no=202510005&flag=1]]></guid><cfi:id>1</cfi:id><cfi:read>true</cfi:read></item>
</channel>
</rss>