<?xml version="1.0" encoding="utf-8"?>
<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom" xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005">
<channel xmlns:cfi="http://www.microsoft.com/schemas/rss/core/2005/internal" cfi:lastdownloaderror="None">
<title cf:type="text"><![CDATA[《情报工程》编辑部 -->情报技术]]></title>
<item>
<title xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="text"><![CDATA[金融领域标准文献知识图谱的构建与实现]]></title>
<link><![CDATA[http://tie.istic.ac.cn/qbgc/ch/reader/view_abstract.aspx?file_no=202206009&flag=1]]></link>
<description xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="html"><![CDATA[[ 目的 / 意义 ] 金融标准是实现金融交易信息系统互联互通、降低交易成本的基本条件，以系统的视角分析标准文献间的替代过程和相互关系等，将有助于推动标准情报的有效分析和金融领域标准化政策的提出。[ 方法 / 过程 / 结果 ]本文采用基于 RDM 模型的知识图谱构建流程，构建了金融领域标准文献的知识图谱，实现并分析了金融领域标准—主题—关键词之间的相互关联关系，印证了 RDM 模型的可行性。通过上述技术和实践探索，以期为金融领域标准化工作提供参考和借鉴。]]></description>
<pubDate>2023/2/14 16:50:01</pubDate>
<category><![CDATA[情报技术]]></category>
<author><![CDATA[赵伟，张览，望俊成]]></author>
<guid><![CDATA[http://tie.istic.ac.cn/qbgc/ch/reader/view_abstract.aspx?file_no=202206009&flag=1]]></guid><cfi:id>24</cfi:id><cfi:read>true</cfi:read></item>
<item>
<title xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="text"><![CDATA[基于语义信息共享 Transformer 的古文机器翻译方法]]></title>
<link><![CDATA[http://tie.istic.ac.cn/qbgc/ch/reader/view_abstract.aspx?file_no=202206010&flag=1]]></link>
<description xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="html"><![CDATA[[ 目的 / 意义 ] 中国古籍浩如烟海，承载了古人的精神和智慧，对古文进行翻译有利于继承和发扬中华传统文化。随着人工智能技术的发展，利用计算机实现古文的自动翻译具有重要意义。[ 方法 / 过程 ] 然而，目前对古文进行机器翻译的研究还比较少。因此，本文根据古文与现代文属于同一语言的特点，通过共享词表与嵌入层参数的方法，提出了基于语义信息共享的 Transformer 模型实现古文到现代文的自动翻译，使用 BLEU 作为评价指标。[ 结果 / 结论 ] 实验表明，该模型的 BLEU 值达到了 31.43，相比传统的基于 GRU 和 LSTM 的 seq2seq 模型分别提高了 26.94 和 15.19 个 BLEU 值，比基准 Transformer 模型提高了 13.41 个 BLEU 值，证明了模型的有效性。]]></description>
<pubDate>2023/2/14 16:50:01</pubDate>
<category><![CDATA[情报技术]]></category>
<author><![CDATA[周成彬，刘忠宝]]></author>
<guid><![CDATA[http://tie.istic.ac.cn/qbgc/ch/reader/view_abstract.aspx?file_no=202206010&flag=1]]></guid><cfi:id>23</cfi:id><cfi:read>true</cfi:read></item>
<item>
<title xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="text"><![CDATA[美国兰德公司遴选颠覆性技术的新型方法及借鉴启示]]></title>
<link><![CDATA[http://tie.istic.ac.cn/qbgc/ch/reader/view_abstract.aspx?file_no=202406001&flag=1]]></link>
<description xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="html"><![CDATA[[目的/意义] 探索兰德公司为支撑美国政府而研制的新型颠覆性技术评估遴选方法，以期为我国在目标约束下的颠覆性技术遴选评估工作提供理论与实践参考。[方法/过程] 以兰德公司为美国政府制定的新型遴选评估方法为研究对象，对其遴选评估颠覆性技术的研究过程进行分析，总结归纳该新型方法的步骤、流程与创新之处。[结果/结论]兰德公司对于颠覆性技术遴选的研究相对较为成熟，分析其相关做法与创新之处，对于优化我国颠覆性技术遴选评估方案，完善我国颠覆性技术的评选、资助方式以及实现国家长期科技创新战略布局具有重要意义。]]></description>
<pubDate>2025/3/24 10:12:09</pubDate>
<category><![CDATA[情报技术]]></category>
<author><![CDATA[崔怡雯，吴毅华，刘巧虹，赵筱媛，苏成]]></author>
<guid><![CDATA[http://tie.istic.ac.cn/qbgc/ch/reader/view_abstract.aspx?file_no=202406001&flag=1]]></guid><cfi:id>22</cfi:id><cfi:read>true</cfi:read></item>
<item>
<title xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="text"><![CDATA[出版产业链技术关系抽取研究]]></title>
<link><![CDATA[http://tie.istic.ac.cn/qbgc/ch/reader/view_abstract.aspx?file_no=202406002&flag=1]]></link>
<description xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="html"><![CDATA[[目的/意义]出版产业链中技术与产业链环节的关系对于出版产业技术谱系的构建和出版产业的监测具有重要意义。[方法/过程]设计了传统出版和数字出版的产业链环节，并从业务环节、产业术语、技术术语、参与主体、产品服务等维度进行了产业技术谱系设计。在获取出版产业技术谱系实体后，利用句法依存分析工具获取实体之间的关系模板，使用MeanTeacher深度学习训练框架和BiGRU+Attention神经网络编码器实现了基于关系模板质量的关系抽取模型；然后使用部分人工标注的半监督深度学习方法对关系模板进行了分类标注和关系分类的模型训练。[局限]未来仍需研究如何提高关系模板中关系类型的识别准确率，通过改进深度学习模型框架来提高模型的性能。[结果/结论]实验表明该关系抽取模型在实际语料库文本中可获得66%的准确率，消融实验表明模板质量等级划分能带来1%的正确率提升。]]></description>
<pubDate>2025/3/24 10:12:10</pubDate>
<category><![CDATA[情报技术]]></category>
<author><![CDATA[韦向峰，张全，袁毅]]></author>
<guid><![CDATA[http://tie.istic.ac.cn/qbgc/ch/reader/view_abstract.aspx?file_no=202406002&flag=1]]></guid><cfi:id>21</cfi:id><cfi:read>true</cfi:read></item>
<item>
<title xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="text"><![CDATA[基于主题模型的政策工具自动标注研究]]></title>
<link><![CDATA[http://tie.istic.ac.cn/qbgc/ch/reader/view_abstract.aspx?file_no=202406003&flag=1]]></link>
<description xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="html"><![CDATA[[目的/意义]政策工具的标注工作是政策研究与政策工具识别模型建立的重要基础，针对人工编码等传统的政策工具标注手段具有主观性且成本高的问题，提出一种基于主题模型的政策工具自动标注方法，以期提高政策工具标注的效率。[方法/过程]首先，通过政策工具理论与候选政策文本的关键词生成政策工具标注标签。随后，将获取的政策文本进行细分处理，对细分后的文本进行BTM主题挖掘，生成政策工具主题标签。最后，利用Word2Vec词嵌入模型将标注标签与主题标签转换为向量进行匹配度计算，得到政策工具的标注结果。[结果/结论]以“双一流”政策文本为例进行实证研究，结果表明，该方法能够较为准确地标注出政策文本中隐含的政策工具，可以应用到今后的政策分析工作中。]]></description>
<pubDate>2025/3/24 10:12:10</pubDate>
<category><![CDATA[情报技术]]></category>
<author><![CDATA[程佳雪，于卫红，齐勇凯，马一鸣]]></author>
<guid><![CDATA[http://tie.istic.ac.cn/qbgc/ch/reader/view_abstract.aspx?file_no=202406003&flag=1]]></guid><cfi:id>20</cfi:id><cfi:read>true</cfi:read></item>
<item>
<title xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="text"><![CDATA[基于深度语义理解的“技术—知识”关联实体识别及演化分析研究]]></title>
<link><![CDATA[http://tie.istic.ac.cn/qbgc/ch/reader/view_abstract.aspx?file_no=202405007&flag=1]]></link>
<description xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="html"><![CDATA[[目的/意义]从细粒度视角理解“技术—知识”关联实体，构建专利文献中技术要素与知识要素识别的实现方案。[方法/过程]选取传统机器学习模型HMM、CRF，深度学习模型BiLSTM-CRF、BERT-Softmax、BERT-CRF和BERTBiLSTM-CRF进行任务训练学习，以便确定性能最优的细粒度技术与知识实体识别模型。[结果/结论]为了验证所构建技术与知识实体识别的理论框架，以出版印刷领域文本作为实验验证场景，从专利文本中随机抽取7853条有效语料句，标注了71626个实体，通过训练学习确定BERT-BiLSTM-CRF为性能较好的实体识别模型，其对知识与技术实体识别综合性能F1值为0.82。此外，运用训练出的最优模型从66665篇专利文本的第一权利要求、权利要求、独立权利要求和技术功效中识别出4769296对知识与技术实体关联组合体，并分析了技术演化路径和“技术—知识”关联网络结构的演化规律。]]></description>
<pubDate>2024/12/30 14:39:10</pubDate>
<category><![CDATA[情报技术]]></category>
<author><![CDATA[杨金庆，李嘉琦，杨儒汉，罗星雨，程秀峰]]></author>
<guid><![CDATA[http://tie.istic.ac.cn/qbgc/ch/reader/view_abstract.aspx?file_no=202405007&flag=1]]></guid><cfi:id>19</cfi:id><cfi:read>true</cfi:read></item>
<item>
<title xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="text"><![CDATA[基于BERTopic主题模型融合RoBERTa算法的短文本分类方法研究]]></title>
<link><![CDATA[http://tie.istic.ac.cn/qbgc/ch/reader/view_abstract.aspx?file_no=202405008&flag=1]]></link>
<description xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="html"><![CDATA[[目的/意义]针对短文本分类中的稀疏问题，提出一种基于BERTopic-RoBERTa-PCA-CatBoost模型进行主题概率特征扩展的短文本分类方法。[方法/过程]使用RoBERTa模型获取短文本的词向量表示，使用BERTopic主题模型提取主题概率特征向量，二者融合进行特征扩展，最后通过CatBoost算法分类。[局限]在分类层面，未使用深度学习算法进行验证；在特征融合层面，未来可以考虑其他的特征融合方法。[结果/结论]提出的BERTopic-RoBERTa-PCACatBoost模型与LDA-CatBoost模型相比在准确率上提升10.90%，精确率上提升10.91%，召回率上提升10.68%。基于主题概率特征扩展的短文本分类方法能够克服单一模型的不足，提高短文本分类的效果。]]></description>
<pubDate>2024/12/30 14:39:10</pubDate>
<category><![CDATA[情报技术]]></category>
<author><![CDATA[刘桂锋，陈亦侯，包翔，韩牧哲]]></author>
<guid><![CDATA[http://tie.istic.ac.cn/qbgc/ch/reader/view_abstract.aspx?file_no=202405008&flag=1]]></guid><cfi:id>18</cfi:id><cfi:read>true</cfi:read></item>
<item>
<title xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="text"><![CDATA[基于多源数据的疾病知识图谱构建研究]]></title>
<link><![CDATA[http://tie.istic.ac.cn/qbgc/ch/reader/view_abstract.aspx?file_no=202404001&flag=1]]></link>
<description xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="html"><![CDATA[[目的/意义]基于PubMed、OMIM等医学数据库中的多源数据设计疾病知识图谱构建方案，为疾病的生物学实验研究及诊断治疗提供参考和依据。[方法/过程]首先利用语义分析工具SemRep抽取SPO三元组，通过实体对齐、关系映射等数据处理方法进行知识融合，然后利用Neo4j图数据库实现知识存储及可视化展示，以多囊卵巢综合征为例进行实证检验和分析，最终获得61589个SPO三元组、34697个实体和27种语义关系并归纳总结7种语义模式。[局限]数据处理时，涉及人工审查，但由于数据量较大，审查过程中可能存在些许误差。[结果/结论]本研究改进现有的知识融合方法，验证了该疾病知识图谱构建方案的可行性。为后续基于疾病知识图谱进行医学领域知识发现探索奠定基础。]]></description>
<pubDate>2024/10/9 15:19:00</pubDate>
<category><![CDATA[情报技术]]></category>
<author><![CDATA[孙丝雨，侯跃芳，丁敬达，梅佳月，孙佳]]></author>
<guid><![CDATA[http://tie.istic.ac.cn/qbgc/ch/reader/view_abstract.aspx?file_no=202404001&flag=1]]></guid><cfi:id>17</cfi:id><cfi:read>true</cfi:read></item>
<item>
<title xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="text"><![CDATA[基于预训练语言模型的电网检修计划异常检测]]></title>
<link><![CDATA[http://tie.istic.ac.cn/qbgc/ch/reader/view_abstract.aspx?file_no=202404002&flag=1]]></link>
<description xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="html"><![CDATA[[目的/意义]电网检修计划异常检测技术可以发现电网检修计划内存在的异常，对于电网通信系统检修活动的正常开展和电力通信系统的稳定运行至关重要。目前，电网检修计划异常检测主要依靠人工判别的方式寻找检修计划的异常，存在准确率低与效率低下的问题。[方法/过程]提供了一种基于预训练语言模型的电网检修计划异常检测方法，使用电网的检修计划数据对预训练语言模型进行微调，使得预训练语言模型能够获取相关领域的专业知识，同时充分利用预训练语言模型的上下文感知能力和领域通用性，使预训练语言模型能够深入理解检修计划的复杂语境，从而发现检修计划中存在的异常。[结果/结论]实验证明，相较于传统方法，该异常检测方法能够有效优化电网检修计划异常检测的性能。]]></description>
<pubDate>2024/10/9 15:19:00</pubDate>
<category><![CDATA[情报技术]]></category>
<author><![CDATA[吴海洋，吴子辰，吴博科，高华，王莘然，胡伟]]></author>
<guid><![CDATA[http://tie.istic.ac.cn/qbgc/ch/reader/view_abstract.aspx?file_no=202404002&flag=1]]></guid><cfi:id>16</cfi:id><cfi:read>true</cfi:read></item>
<item>
<title xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="text"><![CDATA[考虑数据维度与质量维度二重性的数据质量评估研究]]></title>
<link><![CDATA[http://tie.istic.ac.cn/qbgc/ch/reader/view_abstract.aspx?file_no=202404003&flag=1]]></link>
<description xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="html"><![CDATA[[目的/意义]针对数据开发中关联性差、完整性不足所引发的高成本问题，本文构建了考虑数据维度与质量维度的数据质量评估模型，旨在评估数据的各维度质量并进行价值分析。[方法/过程]首先通过数据质量相关的文献分析，利用修正德尔菲法构建了数据质量维度指标体系；之后使用层次分析法选取指标，采用蒙特卡洛采样计算Shapley值进而构建了针对数据不同维度的质量评估模型。在房地产数据质量评估案例中，对其12个数据维度运用质量评估模型进行评估，结果显示其中三个维度质量较差，建议删除，同时针对其他维度提出了修改意见。[局限]未解决数据质量维度指标难以量化问题，也未对数据进行分类，仅提出笼统的评估模型。[结果/结论]将数据维度和数据质量维度进行融合，并基于数据质量维度指标体系及Shapley构建了一个较为全面的数据质量评估模型，能更为详细地对数据库进行质量评估。]]></description>
<pubDate>2024/10/9 15:19:00</pubDate>
<category><![CDATA[情报技术]]></category>
<author><![CDATA[刘枬，刘润，李卓城]]></author>
<guid><![CDATA[http://tie.istic.ac.cn/qbgc/ch/reader/view_abstract.aspx?file_no=202404003&flag=1]]></guid><cfi:id>15</cfi:id><cfi:read>true</cfi:read></item>
<item>
<title xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="text"><![CDATA[面向民用飞机装配工艺规范数字化建设的标准元数据质量测评研究]]></title>
<link><![CDATA[http://tie.istic.ac.cn/qbgc/ch/reader/view_abstract.aspx?file_no=202404004&flag=1]]></link>
<description xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="html"><![CDATA[[目的/意义]国内民用飞机装配工艺规范数字化建设相对国外缓慢，实践过程中存在很多阻滞。目前鲜有从数字化需求对标准元数据质量进行测评的研究，相关研究既能从内容层面对元数据描述提出建设性意见，提高标准信息资源的数字化质量，又能推进民用飞机装配工艺数字化进程，助力智能制造。[方法/过程]对工艺规范与标准信息资源概念进行对比，分析民用飞机装配工艺规范数字化及标准元数据进展；理清民用飞机装配工艺规范数字化需求，基于调整后的BruceHillmann测评指标确定了工艺规范数字化需求下的标准元数据质量测评方案；以国家军用标准全文服务系统为例，对标最新版国家《标准文献元数据》，分析元数据对标准内容的揭示程度与数字化需求之间的差距，提出建议。[局限]单案例研究，典型性和全面性仍有待验证。[结果/结论]分析民用飞机装配工艺规范数字化进展和需求发现：数字化质量亟待提高，面向航空工艺规范的元数据标准是学界及业界需要共同解决的问题；通过测评数据发现：在描述上，元数据类型划分针对性不强，内容描述粗粒度，具体对象需求数据分散化，图表数字化程度低。因此建议：建立行业工艺规范元数据标准，提升工艺规范数据描述精度，以对象为中心推进工艺规范数据模块化，协调标准界、数据库商、业界共同推进工艺规范制定与同步数字化。]]></description>
<pubDate>2024/10/9 15:19:00</pubDate>
<category><![CDATA[情报技术]]></category>
<author><![CDATA[苏萍，邹小筑，安鲁陵]]></author>
<guid><![CDATA[http://tie.istic.ac.cn/qbgc/ch/reader/view_abstract.aspx?file_no=202404004&flag=1]]></guid><cfi:id>14</cfi:id><cfi:read>true</cfi:read></item>
<item>
<title xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="text"><![CDATA[基于知识图谱和大模型的博物馆智能问答系统研究]]></title>
<link><![CDATA[http://tie.istic.ac.cn/qbgc/ch/reader/view_abstract.aspx?file_no=202506001&flag=1]]></link>
<description xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="html"><![CDATA[[目的 /意义 ] 随着博物馆的建设规模和参观人数日益增长，对博物馆的服务形式和服务能力也提出了更高的要求。以某自然博物馆为例探索一种基于知识图谱和大模型的问答系统构建新方法，整合大模型和知识图谱各自具备的优势，提升博物馆公众服务能力。[方法/过程]在知识图谱构建过程中，为了提升该博物馆知识图谱的构建效率、降低构建成本，对 13B 大模型进行微调训练，利用微调后的模型抽取构建图谱所需的实体、关系和属性等元素。问答系统将大模型与知识图谱相结合，利用大模型识别用户意图并提取实体和关系在知识图谱中进行精准匹配，用匹配结果设计提示词交由大模型推理并返回最终结果。[ 结果 / 结论 ] 知识抽取平均准确率达到了 85% 以上，整体召回率为 88%，满足知识图谱构建和更新的工作需要。在问答系统单轮问答准确率为 91.00%，基于上下文的多轮对话准确率为 88.93%，可以满足博物馆使用需求。]]></description>
<pubDate>2026/4/7 10:49:32</pubDate>
<category><![CDATA[情报技术]]></category>
<author><![CDATA[李哲，孙鹏劼]]></author>
<guid><![CDATA[http://tie.istic.ac.cn/qbgc/ch/reader/view_abstract.aspx?file_no=202506001&flag=1]]></guid><cfi:id>13</cfi:id><cfi:read>true</cfi:read></item>
<item>
<title xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="text"><![CDATA[科学数据管理政策知识图谱构建与应用研究]]></title>
<link><![CDATA[http://tie.istic.ac.cn/qbgc/ch/reader/view_abstract.aspx?file_no=202506002&flag=1]]></link>
<description xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="html"><![CDATA[[目的/意义]汇总和梳理我国科学数据管理政策内容，研究政策重点，探究科学数据管理政策的现状。[方法/过程]以我国科学数据管理政策为研究对象，对政策进行可视化梳理，基于 Neo4j 工具，以可视化形式分析政策内容结构，识别政策实施重点。[ 结论 / 结果 ] 研究构建的政策知识图谱，共包含 844 个节点与 1254 条边。研究发现当前科学数据管理政策注重于数据管理规范、数据安全与隐私保障、数据开放共享，通过对政策的可视化与聚类分析，结合上述内容提出管理建议。]]></description>
<pubDate>2026/4/7 10:49:32</pubDate>
<category><![CDATA[情报技术]]></category>
<author><![CDATA[支凤稳，韩梦娇，陈依萌，郭诗悦，郑彦宁]]></author>
<guid><![CDATA[http://tie.istic.ac.cn/qbgc/ch/reader/view_abstract.aspx?file_no=202506002&flag=1]]></guid><cfi:id>12</cfi:id><cfi:read>true</cfi:read></item>
<item>
<title xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="text"><![CDATA[基于 UIE 系列模型的古籍文本自动标注性能比较研究]]></title>
<link><![CDATA[http://tie.istic.ac.cn/qbgc/ch/reader/view_abstract.aspx?file_no=202506003&flag=1]]></link>
<description xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="html"><![CDATA[[目的/意义]古籍标注是古籍信息处理的基础，传统的人工标注方式费时费力，如何高效、准确地对古籍文本进行自动标注成为了一个亟待解决的问题。利用 UIE 系列模型在文本信息抽取方面的优势，结合古籍文本的特点，引入古籍文本的针对性技术，探究该模型在古籍文本自动标注方面的有效性及差异性。[方法/过程]围绕实体关系抽取与事件论元抽取两类任务进行分析，从准确率、召回率、F1 值等方面对古籍文本的自动标注性能进行比较，以期明晰模型规模、领域适应性以及标注质量之间的关系。[ 结果 / 结论 ]《二十四史》语料集上的实验结果表明，随着模型规模和训练样本规模的增大，UIE 系列模型的标注性能呈上升趋势，当训练样本规模为 2500 例上下时，实体关系抽取和事件论元抽取的 F1 值均达到最优，分别为 72.08% 和 70.57%。]]></description>
<pubDate>2026/4/7 10:49:32</pubDate>
<category><![CDATA[情报技术]]></category>
<author><![CDATA[王起扬，刘忠宝]]></author>
<guid><![CDATA[http://tie.istic.ac.cn/qbgc/ch/reader/view_abstract.aspx?file_no=202506003&flag=1]]></guid><cfi:id>11</cfi:id><cfi:read>true</cfi:read></item>
<item>
<title xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="text"><![CDATA[基于BERT模型的科技成果中图分类自动标引方法研究]]></title>
<link><![CDATA[http://tie.istic.ac.cn/qbgc/ch/reader/view_abstract.aspx?file_no=202505001&flag=1]]></link>
<description xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="html"><![CDATA[[目的/意义]深度学习预训练语言模型（PLMs）在科技文献领域分类中的应用效果远超传统自然语言处理技术。科技成果登记数据与科技文献有显著差异，其简介涵盖项目来源、背景、应用、获奖等多方面内容，从而大大增加了PLMs 对科技成果中图分类预测的难度。[方法/过程] 以BERT 模型（RoBERTa）为基础，在模型集成方法上有所创新，构建科技成果中图分类自动标引系统。通过引入普适于树形分类体系的解码策略，将分类问题转化为解码问题，此举既提升了预测准确率，又突破了传统分类模型只能在单层级预测的局限，实现了动态预测。[局限]受限于所采用的树形分类体系专属解码策略，暂无法适配不具备树形结构的分类体系。[结果/结论]通过定制预测链累积概率、终端概率等筛选条件，该方法可平衡可靠性与分类细致度，满足不同实际业务需求。]]></description>
<pubDate>2026/3/11 16:50:35</pubDate>
<category><![CDATA[情报技术]]></category>
<author><![CDATA[薛钊，刘千祥，吴昌权，李亢，陈永海]]></author>
<guid><![CDATA[http://tie.istic.ac.cn/qbgc/ch/reader/view_abstract.aspx?file_no=202505001&flag=1]]></guid><cfi:id>10</cfi:id><cfi:read>true</cfi:read></item>
<item>
<title xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="text"><![CDATA[融合大语言模型的标准知识图谱构建与应用——以医疗器械为例]]></title>
<link><![CDATA[http://tie.istic.ac.cn/qbgc/ch/reader/view_abstract.aspx?file_no=202505002&flag=1]]></link>
<description xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="html"><![CDATA[[目的/意义] 标准数字化浪潮席卷各行业，针对现有标准知识图谱的技术手段已无法满足日益增长的知识处理需求，亟须探索标准文献知识图谱与大模型等新兴技术结合的路径。[方法/过程] 以医疗器械为例，通过对比各类型元数据、分析标准结构完成模式层构建，融合规则与大语言模型完成数据层构建，并结合大语言模型探究知识图谱应用。[局限] 在知识图谱的构建过程中，对于重复知识以及需要进行消歧处理的部分，缺乏高效的知识工作机制。[结果/ 结论]提出含29 类实体、19 类关系的本体，提出融合规则与大语言模型的知识抽取方法，构建了含354548个实体、434484条关系的知识图谱，并探究验证图谱的标准知识检索与分析功能，展现出大语言模型融合标准知识图谱在提升标准数字化水平方面的独特优势。]]></description>
<pubDate>2026/3/11 16:50:35</pubDate>
<category><![CDATA[情报技术]]></category>
<author><![CDATA[周贞云，金江威]]></author>
<guid><![CDATA[http://tie.istic.ac.cn/qbgc/ch/reader/view_abstract.aspx?file_no=202505002&flag=1]]></guid><cfi:id>9</cfi:id><cfi:read>true</cfi:read></item>
<item>
<title xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="text"><![CDATA[美国情报界主题识别与预测研究——基于LDA的分析]]></title>
<link><![CDATA[http://tie.istic.ac.cn/qbgc/ch/reader/view_abstract.aspx?file_no=202505003&flag=1]]></link>
<description xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="html"><![CDATA[[目的/意义] 通过系统分析特朗普与拜登两届政府时期美国情报界政策文本的核心主题及热度演变规律，预测特朗普2.0 时代情报研究焦点，并得出对中国的战略启示。[方法/过程] 基于美国情报界9大机构192份政策文本，采用LDA 主题模型识别主题，设计主题热度公式量化分析。[局限] 传统LDA 模型以及公开文本的覆盖范围有限。[结果/结论] 技术驱动的核心地位、地缘政治威胁的长期性以及非传统安全议题的政治化构成显著共性；热度演化趋势凸显在安全优先方向、技术治理深度以及非传统威胁评估模式上的系统性差异。预测特朗普2.0 时代将聚焦国防安全、网络安全、人工智能、信息安全、伊核问题、公共卫生事件，并受领导人主观偏好影响，为我国提供了重要的镜鉴和启示。]]></description>
<pubDate>2026/3/11 16:50:35</pubDate>
<category><![CDATA[情报技术]]></category>
<author><![CDATA[郝新杰]]></author>
<guid><![CDATA[http://tie.istic.ac.cn/qbgc/ch/reader/view_abstract.aspx?file_no=202505003&flag=1]]></guid><cfi:id>8</cfi:id><cfi:read>true</cfi:read></item>
<item>
<title xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="text"><![CDATA[科技信息孪生系统分层防御体系研究]]></title>
<link><![CDATA[http://tie.istic.ac.cn/qbgc/ch/reader/view_abstract.aspx?file_no=202505004&flag=1]]></link>
<description xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="html"><![CDATA[[目的/意义]科技信息孪生系统因虚实交互复杂、数据敏感，面临严峻跨域攻击与隐私泄露风险，构建适配防御体系可为后续研究提供参考。[方法/过程] 通过文献调研与概念分析，明确科技信息孪生系统的内涵特征，提炼出科技信息多元融合、信息传递的分层实时适配性、物理—虚拟闭环协同、系统架构协同复杂四方面特征，以及用户需求、网络架构、数据类型、调整能力、技术选型、法律与合规性等六个影响因素，进而分析防御需求与发展趋势。[结果/结论] 提出在“虚实交互—威胁响应—策略优化”循环中实现动态防护，从网络边界、信息收集与分析、数据保护、应用与服务、跨域协同防御五维度构建框架。该框架突破传统模式，打破虚实防护壁垒，融入动态自适应机制，形成多维度分层次立体防御体系。]]></description>
<pubDate>2026/3/11 16:50:35</pubDate>
<category><![CDATA[情报技术]]></category>
<author><![CDATA[刘勇]]></author>
<guid><![CDATA[http://tie.istic.ac.cn/qbgc/ch/reader/view_abstract.aspx?file_no=202505004&flag=1]]></guid><cfi:id>7</cfi:id><cfi:read>true</cfi:read></item>
<item>
<title xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="text"><![CDATA[基于多源信息融合的专家画像方法研究]]></title>
<link><![CDATA[http://tie.istic.ac.cn/qbgc/ch/reader/view_abstract.aspx?file_no=202505005&flag=1]]></link>
<description xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="html"><![CDATA[[目的/意义]在项目评审、人才评价、机构评估改革等科研评价工作中，同行评议专家的遴选是最重要的环节，专家遴选的准确性在很大程度上影响评议结果的质量，而这种准确性高度依赖专家标签的质量，专家画像研究是科研评议面临的重要问题之一。[方法/过程]提出一种基于多源信息融合的专家画像构建方法。该方法通过融合多源异构数据提取不同角度的专家科研指标，使用BERT 预训练模型和Bi-LSTM 进行实体抽取，获得更加全面的专家标签特征。[局限] 需要一定量的数据用于提前预训练BERT 模型。[结果/结论] 该方法能够为专家刻画更加丰富的画像，为专家画像构建方法研究工作提供参考和借鉴。]]></description>
<pubDate>2026/3/11 16:50:35</pubDate>
<category><![CDATA[情报技术]]></category>
<author><![CDATA[李贞亮，吴振峰，高嵩，张宇飞，刘晗，李龙豪]]></author>
<guid><![CDATA[http://tie.istic.ac.cn/qbgc/ch/reader/view_abstract.aspx?file_no=202505005&flag=1]]></guid><cfi:id>6</cfi:id><cfi:read>true</cfi:read></item>
<item>
<title xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="text"><![CDATA[大模型赋能下学术文献服务中的智能化应用研究]]></title>
<link><![CDATA[http://tie.istic.ac.cn/qbgc/ch/reader/view_abstract.aspx?file_no=202501001&flag=1]]></link>
<description xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="html"><![CDATA[[ 目的/ 意义] 大模型等人工智能新技术正影响着人类信息获取和信息创造方式，加速催生学术文献信息服务的新产品、新形态。对学术文献服务中的智能化应用现状进行深入分析，有助于把握现阶段学术文献服务领域智能化应用的成效、不足和未来发展趋势，为进一步的转型升级和智能化创新服务提供参考和启示。[ 方法/ 过程] 在网络调研、文献调研和对各系统实际操作使用的基础上，对国内外典型文献检索发现AI 应用工具的智能应用场景、功能和特点进行总结分析，并与传统学术文献服务进行对比分析，面向科研过程各阶段的科研需求进行支撑分析，对未来学术文献服务的智能化应用发展进行趋势分析和展望。[ 结果/ 结论] 普遍形成了自然语言检索及智能问答的创新服务模式、更细粒度的知识服务内容，在用户输入、信息匹配、结果呈现、交互体验、个性化服务等多个方面初具成效。目前仍处于大模型落地应用初期，结合科研全流程的需求和痛点，提出未来学术文献智能知识服务的展望，一是提升多轮对话下的精准服务能力，向“人— 机— 智”深度融合的高效交互发展，二是打造文本+ 表格+ 图像+ 多维度知识库的细粒度多模态统一智能知识服务，三是个性化、高价值知识创新服务场景与应用的拓展深化。]]></description>
<pubDate>2025/5/26 17:01:00</pubDate>
<category><![CDATA[情报技术]]></category>
<author><![CDATA[孟旭阳，白海燕，吕世炅，宋梦鹏]]></author>
<guid><![CDATA[http://tie.istic.ac.cn/qbgc/ch/reader/view_abstract.aspx?file_no=202501001&flag=1]]></guid><cfi:id>5</cfi:id><cfi:read>true</cfi:read></item>
<item>
<title xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="text"><![CDATA[融合BERTopic 和大语言模型的研究前沿识别——以美国NSF人工智能领域资助为例]]></title>
<link><![CDATA[http://tie.istic.ac.cn/qbgc/ch/reader/view_abstract.aspx?file_no=202501002&flag=1]]></link>
<description xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="html"><![CDATA[[目的/意义] 为了解决研究前沿识别中主题建模缺少语义化的主题表达、基于关键词和人工判别的主题命名较为主观、未考虑主题相关文档内容等问题，引入大语言模型对生成的研究主题进行语义增强，以提高研究前沿识别的准确性和客观性。[方法/过程] 首先梳理了研究前沿的相关概念，以及主要识别理论、方法，然后以基金项目为数据源，通过BERTopic 进行主题识别，使用大语言模型进行主题命名，识别出了隐含在基金项目中的研究主题，提出了研究前沿测度指标体系，并使用Critic 客观赋权法确定了指标权重。[局限] 大模型生成的主题短语部分内容语义较为模糊，未能使用业领域内的术语来表达，且研究所使用的数据仅限于基金项目数据。[ 结果/ 结论] 以人工智能领域NSF 资助的科研项目为例，识别出了机器人、机器学习算法、智能教育、数据管理、模拟仿真等研究前沿，通过与美国人工智能规划及技术评估和预测报告的内容进行对比后发现，识别出的研究前沿具有一定的合理性和前瞻性。]]></description>
<pubDate>2025/5/26 17:01:00</pubDate>
<category><![CDATA[情报技术]]></category>
<author><![CDATA[范旭辉，穆智蕊]]></author>
<guid><![CDATA[http://tie.istic.ac.cn/qbgc/ch/reader/view_abstract.aspx?file_no=202501002&flag=1]]></guid><cfi:id>4</cfi:id><cfi:read>true</cfi:read></item>
<item>
<title xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="text"><![CDATA[基于大模型和知识图谱的电网检修计划智能编排]]></title>
<link><![CDATA[http://tie.istic.ac.cn/qbgc/ch/reader/view_abstract.aspx?file_no=202501003&flag=1]]></link>
<description xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="html"><![CDATA[[目的/意义]提出一种结合大语言模型和知识图谱技术的电网检修计划智能编排方法，以提高检修计划编排的效率和质量。[方法/过程]利用大语言模型处理自然语言查询，并结合智能编排算法和图数据库技术，从电网公司诸多论文和专利中提取检修计划相关数据与总结编排规则，构建大规模问答数据集进行训练和验证。通过引入知识图谱技术，基于检修票据记录构建检修计划知识图谱，本方法能够更有效地表示和推理检修计划中的实体关系，从而提高实体识别和智能编排任务的性能。[ 结果/ 结论] 主要研究结论显示，相较于现有技术，所提方法在实体识别和智能编排任务中性能更优，准确率更高，且能显著减少人力成本投入，为电网检修计划智能化提供了有效解决方案。]]></description>
<pubDate>2025/5/26 17:01:00</pubDate>
<category><![CDATA[情报技术]]></category>
<author><![CDATA[吴子辰，顾彬，张云翔，王莘然，高华]]></author>
<guid><![CDATA[http://tie.istic.ac.cn/qbgc/ch/reader/view_abstract.aspx?file_no=202501003&flag=1]]></guid><cfi:id>3</cfi:id><cfi:read>true</cfi:read></item>
<item>
<title xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="text"><![CDATA[融合专利属性和用户行为分析的个性化专利推荐研究]]></title>
<link><![CDATA[http://tie.istic.ac.cn/qbgc/ch/reader/view_abstract.aspx?file_no=202501004&flag=1]]></link>
<description xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="html"><![CDATA[[目的/意义] 提出一种融合专利属性信息和用户行为分析的个性化专利推荐方法，以更好地满足用户的专利文献需求。[方法/过程] 首先量化用户对专利文献的检索与操作行为，计算用户之间的相似性指数；然后结合专利文献的属性信息（如IPC 分类号、发明人等），以实现个性化推荐。将该方法应用于自研的专利推荐系统中，并与其他协同过滤推荐方法进行对比。[局限] 可能受到数据集的特定性限制，如依赖于特定的用户行为和专利文献数据集。此外，实验结果可能会因系统中的用户和专利文献选择不同而有所偏差。[ 结果/ 结论] 实验结果表明，该个性化推荐方法优于传统的用户协同过滤推荐方法，能够更好地理解用户的需求和偏好，从而提高推荐的准确性与效率。]]></description>
<pubDate>2025/5/26 17:01:00</pubDate>
<category><![CDATA[情报技术]]></category>
<author><![CDATA[赵学铭，王刚]]></author>
<guid><![CDATA[http://tie.istic.ac.cn/qbgc/ch/reader/view_abstract.aspx?file_no=202501004&flag=1]]></guid><cfi:id>2</cfi:id><cfi:read>true</cfi:read></item>
<item>
<title xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="text"><![CDATA[大模型时代我国知识服务领域面临的挑战]]></title>
<link><![CDATA[http://tie.istic.ac.cn/qbgc/ch/reader/view_abstract.aspx?file_no=202501005&flag=1]]></link>
<description xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="html"><![CDATA[[目的/意义]大模型快速发展对各行业具有深远影响，着重探讨大模型在知识服务领域的应用。[方法/过程]对大模型发展概况、主要国家或地区发布的相关政策、文献情报领域及知识服务行业针对大模型应用的研究进展进行分析，探讨了国内外主要的知识服务类机构在大模型方面的相关布局和研发特点，分析指出国内知识服务领域在运用大模型过程中面临的挑战，并有针对性地提出应对策略。[结果/结论] 从国产知识服务大模型研发、评估体系构建以及人才队伍的组建和培养方面提出了针对性建议。]]></description>
<pubDate>2025/5/26 17:01:00</pubDate>
<category><![CDATA[情报技术]]></category>
<author><![CDATA[彭鹏]]></author>
<guid><![CDATA[http://tie.istic.ac.cn/qbgc/ch/reader/view_abstract.aspx?file_no=202501005&flag=1]]></guid><cfi:id>1</cfi:id><cfi:read>true</cfi:read></item>
</channel>
</rss>