<?xml version="1.0" encoding="utf-8"?>
<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom" xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005">
<channel xmlns:cfi="http://www.microsoft.com/schemas/rss/core/2005/internal" cfi:lastdownloaderror="None">
<title cf:type="text"><![CDATA[《情报工程》编辑部 -->富媒体知识服务]]></title>
<item>
<title xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="text"><![CDATA[学科交叉视角下新兴主题识别特征分析——以医学信息学为例]]></title>
<link><![CDATA[http://tie.istic.ac.cn/qbgc/ch/reader/view_abstract.aspx?file_no=202104001&flag=1]]></link>
<description xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="html"><![CDATA[[ 目的/ 意义] 本文以医学信息学为例探析了学科交叉视角下新兴主题识别特征，对于进一步的新兴交叉学科主题分析具有一定的意义。[ 方法/ 过程] 本文首先采用统计分析方法对作者数量、发文量以及资助基金项目进行了历时分析，进一步验证学科交叉主题常规计量维度的适用性；然后运用复杂网络方法分析学科交叉视角下新兴主题的交叉融合新特征以及潜在的网络动态特征。[ 结果/ 结论]实验结果表明：常规性特征发文量、作者数量、资助基金项目数呈指数增长；新兴前阶段学科交叉融合速度较快，篇均医学主题词占比呈显著下降趋势而信息科学呈现快速上升趋势；在新兴前阶段，平均度数（average degree）、聚集系数（convergence）、传递性（transitivity）指标值均呈现增长趋势；同时，三方关系组分析中3 边组合的子图数逐年增加，不同学科主题词对的紧密程度明显增强。]]></description>
<pubDate>2021/9/18 17:29:25</pubDate>
<category><![CDATA[富媒体知识服务]]></category>
<author><![CDATA[杨金庆，张力]]></author>
<guid><![CDATA[http://tie.istic.ac.cn/qbgc/ch/reader/view_abstract.aspx?file_no=202104001&flag=1]]></guid><cfi:id>11</cfi:id><cfi:read>true</cfi:read></item>
<item>
<title xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="text"><![CDATA[针对特定任务的方法实体评估研究]]></title>
<link><![CDATA[http://tie.istic.ac.cn/qbgc/ch/reader/view_abstract.aspx?file_no=202104002&flag=1]]></link>
<description xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="html"><![CDATA[[ 目的/ 意义] 在科学的发展中，研究方法扮演着重要角色。收集并分析特定学科的方法实体，能够帮助学者更好地了解该领域的研究方法，并找到适合其自身研究的方法。目前已有针对方法抽取和评价的相关研究，但尚未针对特定任务开展知识实体抽取与评估研究。[ 方法/ 过程] 本文以命名实体识别（Named Entity Recognition，NER）任务为例，从ACL Anthology 网站中收集相关论文，利用内容分析法对论文中作者使用的方法实体进行标注。本文从426 篇学术论文中标注出904 种方法实体。并基于使用次数和使用年代两个维度来评估方法实体影响力。[ 结果/ 结论] 条件随机场是NER 任务中影响力最大的算法，神经网络算法在近五年发展迅猛；学者倾向于使用算法而不是现成的工具进行实体识别；在数据选择方面，经典数据集是学者的首选；F 值、正确率和召回率是影响力最大的评价指标。本文的标注结果能够帮助学者更好地理解该任务，提高科研的效率。实体评估的结果能够为初学者在选择具体研究方法时提供参考。]]></description>
<pubDate>2021/9/18 17:29:25</pubDate>
<category><![CDATA[富媒体知识服务]]></category>
<author><![CDATA[李小乐，王玉琢，章成志]]></author>
<guid><![CDATA[http://tie.istic.ac.cn/qbgc/ch/reader/view_abstract.aspx?file_no=202104002&flag=1]]></guid><cfi:id>10</cfi:id><cfi:read>true</cfi:read></item>
<item>
<title xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="text"><![CDATA[基于异构数据特征向量的图文检索方法研究]]></title>
<link><![CDATA[http://tie.istic.ac.cn/qbgc/ch/reader/view_abstract.aspx?file_no=202104003&flag=1]]></link>
<description xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="html"><![CDATA[[ 目的/ 意义] 互联网中存在的信息多数是以文本、图像、视频等相结合的形式，即所谓的跨媒体数据。传统的检索方式包括以文检文、以图检图，它们已不能满足如今信息检索的需求，所以跨媒体数据检索应运而生，跨媒体数据检索的研究具有非常重要的研究意义及应用价值。[ 方法/ 过程] 本文利用Doc2vec 模型和VGG16 模型分别处理文本和图片数据得到各自的特征值，根据特征值的相对语义距离对文本和图片数据进行匹配，从而实现自动的给文字配图片或者为图片选择标签。[ 结果/ 结论]本文提出的方法能够通过提取不同形式的数据特征对数据进行融合，有效提升了图片和文本数据自动匹配的命中率，实现了基于异构数据特征的图文检索。]]></description>
<pubDate>2021/9/18 17:29:25</pubDate>
<category><![CDATA[富媒体知识服务]]></category>
<author><![CDATA[骆有隆，朱卉钰，梁松宇，张腾]]></author>
<guid><![CDATA[http://tie.istic.ac.cn/qbgc/ch/reader/view_abstract.aspx?file_no=202104003&flag=1]]></guid><cfi:id>9</cfi:id><cfi:read>true</cfi:read></item>
<item>
<title xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="text"><![CDATA[基于高质量专利的企业画像构建研究]]></title>
<link><![CDATA[http://tie.istic.ac.cn/qbgc/ch/reader/view_abstract.aspx?file_no=202103005&flag=1]]></link>
<description xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="html"><![CDATA[[ 目的 / 意义 ] 当前，我国经济已经由高速增长阶段转向高质量发展阶段，有必要面向企业等市场创新主体，从高质量专利的角度出发，开展企业画像研究，以帮助我们深入揭示具体产业创新前沿知识，刻画企业的创新技术背景，拓展面向企业的精准服务。[ 方法 / 过程 ] 本文通过文献调研，梳理了高质量专利识别和企业画像的研究现状，提出了基于高质量专利的企业画像框架，从数据层、识别层、画像层和应用层四个方面进行了阐释，并以四川网络安全产业为例进行案例分析，从地理分布、成立时间、申请数量、技术布局和技术转让等角度为相关企业进行画像，展现了在四川网络安全产业中实践高质量发展的企业群体特征。[ 结果 / 结论 ] 本文提出的企业画像框架对于精准定位扶持对象，调整具体产业布局方向以及践行经济高质量发展等具有重要意义。]]></description>
<pubDate>2021/7/7 9:00:45</pubDate>
<category><![CDATA[富媒体知识服务]]></category>
<author><![CDATA[刘春江，李娜，许海云，方曙]]></author>
<guid><![CDATA[http://tie.istic.ac.cn/qbgc/ch/reader/view_abstract.aspx?file_no=202103005&flag=1]]></guid><cfi:id>8</cfi:id><cfi:read>true</cfi:read></item>
<item>
<title xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="text"><![CDATA[中国 “ 专利悖论 ” 问题探究 —— 一个比较分析]]></title>
<link><![CDATA[http://tie.istic.ac.cn/qbgc/ch/reader/view_abstract.aspx?file_no=202103006&flag=1]]></link>
<description xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="html"><![CDATA[[ 目的 / 意义 ] 本文旨在探讨中国是否存在“专利悖论”问题。[ 方法 / 过程 ] 在阐述“专利悖论”的内涵及成因的基础上，横向比较我国与美国和日本创新投入及产出，纵向探讨我国专利存在的问题。[ 结果 / 结论 ] 中国的确存在“专利悖论”问题，即专利产出与研发投入强度和生产率之间都表现了较弱的关联性。这主要是宏观的专利促进政策以及企业在专利申请和运营上的策略性行动所致。本文的研究试图对改善中国创新激励政策以及知识产权管理提供一定的借鉴。]]></description>
<pubDate>2021/7/7 9:00:45</pubDate>
<category><![CDATA[富媒体知识服务]]></category>
<author><![CDATA[刘红，刘雨欣，张森]]></author>
<guid><![CDATA[http://tie.istic.ac.cn/qbgc/ch/reader/view_abstract.aspx?file_no=202103006&flag=1]]></guid><cfi:id>7</cfi:id><cfi:read>true</cfi:read></item>
<item>
<title xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="text"><![CDATA[离群专利与论文视角下新兴技术主题识别研究]]></title>
<link><![CDATA[http://tie.istic.ac.cn/qbgc/ch/reader/view_abstract.aspx?file_no=202103007&flag=1]]></link>
<description xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="html"><![CDATA[[ 目的 / 意义 ] 针对当前新兴技术识别主要围绕热点专利与论文开展，对低热度专利与论文不够关注，然而由于其类别较多、总体规模较大，极易产生长尾效应。因此，以低热度专利与论文为研究对象，设计新兴技术主题识别方法，以期为国家、企业、机构提供情报支持。[ 方法 / 过程 ] 构建专利、论文相似矩阵，利用社会网络分析工具聚类筛选出离群专利分类号与论文关键词；通过 LDA 模型获取技术主题；短语相似度测算，归并技术主题；围绕新兴技术特征构建识别指标体系对技术主题进行综合评价，识别出新兴技术。[ 结果 / 结论 ] 以车联网为实验对象，识别出无人驾驶技术是车联网领域新兴技术，识别结果与业界分析一致，说明方法有效性。]]></description>
<pubDate>2021/7/7 9:00:45</pubDate>
<category><![CDATA[富媒体知识服务]]></category>
<author><![CDATA[邱悦文]]></author>
<guid><![CDATA[http://tie.istic.ac.cn/qbgc/ch/reader/view_abstract.aspx?file_no=202103007&flag=1]]></guid><cfi:id>6</cfi:id><cfi:read>true</cfi:read></item>
<item>
<title xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="text"><![CDATA[理学和图书情报学领域关于专利分析主题文献的对比研究]]></title>
<link><![CDATA[http://tie.istic.ac.cn/qbgc/ch/reader/view_abstract.aspx?file_no=202103008&flag=1]]></link>
<description xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="html"><![CDATA[[ 目的 / 意义 ] 从管理学和图书情报学两学科视角下深入探讨关于专利分析这一主题的研究特点和趋势，为本领域学者今后在两学科间开展合作交叉研究和跨学科合著提供参考。[ 方法 / 过程 ] 文章以 2010-2019 年 CNKI 收录的管理学和图书情报学期刊所发表的专利分析主题文献为研究对象，运用技术生命周期法和社会网络分析，分别从发文趋势、研究热点和作者合著三方面对比分析两个学科在专利分析研究中的发文特点，揭示在专利分析主题下两学科开展研究的异同之处。[ 结果 / 结论 ] 通过对比分析研究，揭示了两学科在专利分析中的研究重点及可能的交叉方向，提供了可开展合作研究的作者信息，基本可以为促进两学科交流与发展，提高我国专利分析研究的竞争力提供参考。]]></description>
<pubDate>2021/7/7 9:00:45</pubDate>
<category><![CDATA[富媒体知识服务]]></category>
<author><![CDATA[刘佳，魏佳奇]]></author>
<guid><![CDATA[http://tie.istic.ac.cn/qbgc/ch/reader/view_abstract.aspx?file_no=202103008&flag=1]]></guid><cfi:id>5</cfi:id><cfi:read>true</cfi:read></item>
<item>
<title xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="text"><![CDATA[英汉双语富媒体知识图谱构建工程研究——以 CNS 英文期刊为例]]></title>
<link><![CDATA[http://tie.istic.ac.cn/qbgc/ch/reader/view_abstract.aspx?file_no=202305007&flag=1]]></link>
<description xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="html"><![CDATA[[目的/意义]研究自动构建英汉双语富媒体知识图谱的方法和过程，为跨语言多模态知识图谱的自动构建提供借鉴参考，对及时获取最新英文科研成果、科技情报监测等具有重要意义。[方法/过程]采用自顶向下和自底向上相结合的方法，先从顶层设计要抽取的主要实体、属性和关系，从底层非结构化文本数据进行分析抽取细粒度的实体和属性，对有歧义实体和跨语言实体进行实体对齐，对跨媒体的实体进行实体链接，用图数据库实现知识图谱的存储及应用。[局限]未来需进一步提高细粒度实体的抽取正确率，对音视频媒体进行特征提取和内容自动识别。[结果/结论]以 CNS（Cell、Nature、Science）等英文科技期刊网站为例，通过数据抓取、实体抽取、属性抽取、知识融合、跨媒体链接等过程，实现了英汉双语富媒体知识图谱的构建、存储和可视化展示。]]></description>
<pubDate>2024/1/19 16:14:38</pubDate>
<category><![CDATA[富媒体知识服务]]></category>
<author><![CDATA[韦向峰，缪建明，张全，袁毅]]></author>
<guid><![CDATA[http://tie.istic.ac.cn/qbgc/ch/reader/view_abstract.aspx?file_no=202305007&flag=1]]></guid><cfi:id>4</cfi:id><cfi:read>true</cfi:read></item>
<item>
<title xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="text"><![CDATA[基于 BLSTM-CRF 的自举式术语识别方法研究]]></title>
<link><![CDATA[http://tie.istic.ac.cn/qbgc/ch/reader/view_abstract.aspx?file_no=202305008&flag=1]]></link>
<description xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="html"><![CDATA[[目的/意义]自动识别优质术语一直是多领域普遍关注的问题，其中一个突出困难是缺乏领域标注语料，为此本文提出一种基于 BLSTM-CRF 的自举式领域术语识别方法。[方法/过程]首先选取少量种子术语标注语料，训练BLSTM-CRF 模型，识别候选术语；再基于术语质量特征构造筛选准则，从候选术语中挑出优质且新增的结果加入到新一轮训练的标注词汇集合，迭代标注训练，直到新增术语量小于某一阈值或迭代达到特定次数。本文还检测了模型迭代训练效率及在其他领域的推广性，将在计算机领域语料训练出的模型用于新兴的融合出版领域的技术术语识别。[局限]术语质量特征量化方法待综合多指标优化，模型改进学习机制未引入负例且迭代不易收敛等。[结果/结论]本文最终通过标注数量和标注语境丰富度实验表明了采用新增标注数据进行迭代的有效性。以 50 轮迭代训练后结果为例，在计算机测试语料上识别术语及其所有标注序列的 F1 值为 0.43 和 0.59，新术语率为 0.79，均优于基准 BLSTM-CRF 模型、BERT-BLSTM-CRF 模型效果，证实了新方法启动成本低，领域适应性好，能够有效解决术语识别中训练语料缺乏的问题。在模型迁移效能评价中，抽样判断的术语识别平均正确率为 87.7%，说明了迁移学习方法的应用潜力。]]></description>
<pubDate>2024/1/19 16:14:39</pubDate>
<category><![CDATA[富媒体知识服务]]></category>
<author><![CDATA[陈翀，高欣妍，黄红]]></author>
<guid><![CDATA[http://tie.istic.ac.cn/qbgc/ch/reader/view_abstract.aspx?file_no=202305008&flag=1]]></guid><cfi:id>3</cfi:id><cfi:read>true</cfi:read></item>
<item>
<title xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="text"><![CDATA[基于 Lattice LSTM 的中医药古文献命名实体识别与应用研究]]></title>
<link><![CDATA[http://tie.istic.ac.cn/qbgc/ch/reader/view_abstract.aspx?file_no=202305009&flag=1]]></link>
<description xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="html"><![CDATA[[目的/意义]为进一步提升中医药古文献命名实体识别的准确性，以信息化手段辅助现代中医学者进行医学诊断与临床决策，促进中医学的传承与创新。[方法/过程]提出一种集成字符与词汇信息的中医药古文献命名实体识别的 Lattice LSTM 模型，对《伤寒论》的疾病、证候、方剂、症状和药材五类实体进行抽取；在抽取出的实体基础上，人工提取实体间关系，利用 Neo4j 搭建了中医药知识图谱；最后以新冠肺炎为例，在图谱上完成相关检索。[结果/结论] 实验结果表明，Lattice LSTM 在中医术语识别上性能最优，F1 值达到 95.66%，比主流模型 BiLSTM-CRF 提升了 1.68%，可用于中医药古文献的实体识别；搭建的中医药知识图谱也验证了主模型的现实价值。]]></description>
<pubDate>2024/1/19 16:14:39</pubDate>
<category><![CDATA[富媒体知识服务]]></category>
<author><![CDATA[曾江峰，庞雨静，高鹏钰，冯昌扬]]></author>
<guid><![CDATA[http://tie.istic.ac.cn/qbgc/ch/reader/view_abstract.aspx?file_no=202305009&flag=1]]></guid><cfi:id>2</cfi:id><cfi:read>true</cfi:read></item>
<item>
<title xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="text"><![CDATA[面向融合出版前沿主题发现的学术论文未来工作句挖掘研究]]></title>
<link><![CDATA[http://tie.istic.ac.cn/qbgc/ch/reader/view_abstract.aspx?file_no=202305010&flag=1]]></link>
<description xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="html"><![CDATA[[目的/意义]近年来，随着传统出版与数字出版的不断融合，形成了融合出版的新兴范式。如何科学准确地把握融合出版领域未来研究趋势具有重要研究意义。学术论文中描述未来研究工作的句子（简称“未来工作句”），不但
可以辅助预测未来可能出现的前沿主题，还可为科研工作者、特别是初学者选题提供参考。[方法/过程]对融合出版领域论文中的未来工作句进行人工标注和类别划分，构建未来工作句识别与分类语料库。在此基础上，使用支持向量
机、朴素贝叶斯和随机森林三种模型结合 SelectKBest 特征选择方法，来训练未来工作句自动识别模型。[结果/结论]LinearSVC 在未来工作句自动识别任务中表现最为出色，其加权 F1 值达到 92.08%。另外，本文对分类语料库中的未来工作句内容及其类别进行分析，得到融合出版领域未来工作句的类别分布及其变化规律。]]></description>
<pubDate>2024/1/19 16:14:40</pubDate>
<category><![CDATA[富媒体知识服务]]></category>
<author><![CDATA[谢林蕾，向熠，章成志]]></author>
<guid><![CDATA[http://tie.istic.ac.cn/qbgc/ch/reader/view_abstract.aspx?file_no=202305010&flag=1]]></guid><cfi:id>1</cfi:id><cfi:read>true</cfi:read></item>
</channel>
</rss>