<?xml version="1.0" encoding="utf-8"?>
<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom" xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005">
<channel xmlns:cfi="http://www.microsoft.com/schemas/rss/core/2005/internal" cfi:lastdownloaderror="None">
<title cf:type="text"><![CDATA[《情报工程》编辑部 -->文本信息处理]]></title>
<item>
<title xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="text"><![CDATA[基于多跳动态记忆网络和情感词典的情感分析模型]]></title>
<link><![CDATA[http://tie.istic.ac.cn/qbgc/ch/reader/view_abstract.aspx?file_no=202202001&flag=1]]></link>
<description xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="html"><![CDATA[[ 目的 / 意义 ] 文本情感分析是自然语言处理的一大重要分支。论文结合了深度学习模型在特征提取方面的优势以及情感词典对网络词情感识别的敏感性，提出了一种将动态记忆网络和情感词典方法相结合的网络文本情感分类模型。[ 方法 / 过程 ] 在传统的动态记忆网络中设计情感问题向量，利用基于注意力机制的多跳结构识别并提取句子情感特征，同时构建扩充网络情感词的情感词典并将情感分值与多跳记忆网络所得情感分类结果进行线性加权，减少了对于情感词库的完备性、判断规则质量以及事先标注语料的依赖，提升了训练效率。[ 结果 / 结论 ] 在 WEIBO_SENTI_100K和 NLPCC2013 两个数据集上进行实验，证明与单个模型相比，论文模型在两个数据集上都获得了更好的分类效果。]]></description>
<pubDate>2022/6/1 11:25:44</pubDate>
<category><![CDATA[文本信息处理]]></category>
<author><![CDATA[沈金金，陈荔]]></author>
<guid><![CDATA[http://tie.istic.ac.cn/qbgc/ch/reader/view_abstract.aspx?file_no=202202001&flag=1]]></guid><cfi:id>4</cfi:id><cfi:read>true</cfi:read></item>
<item>
<title xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="text"><![CDATA[大规模多粒度中文复述语料库]]></title>
<link><![CDATA[http://tie.istic.ac.cn/qbgc/ch/reader/view_abstract.aspx?file_no=202202002&flag=1]]></link>
<description xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="html"><![CDATA[[ 目的 / 意义 ] 复述是相同语义的不同表达，集中反映了语言的多样性，一直是自然语言处理领域的核心问题。PPDB 英文复述数据集在英文自然语言处理的多种任务中得到了应用，推动了英文自然语言处理领域的发展。缺少大规模多粒度中文复述数据集阻碍了复述技术在中文自然语言处理中的应用，是亟待解决的问题。[ 方法 / 过程 ] 本文实现了一个针对多源数据的复述抽取系统，并抽取构建了一个大规模中文复述数据集，该数据集具有规模大、质量高的特点，且包含复述短语、复述模板和复述句三种粒度的复述文本。[ 结果 / 结论 ] 自动评估和人工评估的结果表明，我们抽取的中文复述数据具有较高的文本多样性和语义一致性。]]></description>
<pubDate>2022/6/1 11:25:44</pubDate>
<category><![CDATA[文本信息处理]]></category>
<author><![CDATA[安波]]></author>
<guid><![CDATA[http://tie.istic.ac.cn/qbgc/ch/reader/view_abstract.aspx?file_no=202202002&flag=1]]></guid><cfi:id>3</cfi:id><cfi:read>true</cfi:read></item>
<item>
<title xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="text"><![CDATA[句子级别机器译文质量估计研究综述]]></title>
<link><![CDATA[http://tie.istic.ac.cn/qbgc/ch/reader/view_abstract.aspx?file_no=202202003&flag=1]]></link>
<description xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="html"><![CDATA[[ 目的 / 意义 ] 近年来，随着估计结果与人工评价的相关性逐步增强，译文质量估计引起了机器翻译研究者们的广泛关注和高度重视，因此对句子级别译文质量估计方法进行归纳整理具有重要意义。[ 方法 / 过程 ] 该文主要是将它们分为基于传统机器学习的方法、基于神经翻译模型的方法和基于预训练语言模型的方法，梳理和对比了这三种译文质量估计方法的代表性工作、交叉工作以及不同方法的发展路线，并介绍了推动译文质量估计研究的相关评测活动和性能评价指标，最后展望句子级别译文质量估计今后的研究方向和发展趋势，并对全文进行总结。[ 结果 / 结论 ] 机器译文质量估计未来的研究方向将会越来越成熟，应用场景也会越来越广泛，有逐步取代传统译文自动评价任务的趋势。]]></description>
<pubDate>2022/6/1 11:25:44</pubDate>
<category><![CDATA[文本信息处理]]></category>
<author><![CDATA[罗兰，何贤敏，李茂西]]></author>
<guid><![CDATA[http://tie.istic.ac.cn/qbgc/ch/reader/view_abstract.aspx?file_no=202202003&flag=1]]></guid><cfi:id>2</cfi:id><cfi:read>true</cfi:read></item>
<item>
<title xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="text"><![CDATA[基于 BERT+A-Softmax 的多分类模型构建与应用研究]]></title>
<link><![CDATA[http://tie.istic.ac.cn/qbgc/ch/reader/view_abstract.aspx?file_no=202202004&flag=1]]></link>
<description xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="html"><![CDATA[[ 目的 / 意义 ] 在信息分类领域中，通过传统的机器学习与深度学习的方法可以对大多数稿件进行分类并取得整体较高的准确率。但是这种方法没有对稿件文体进行区别，而现实生产环境中存在新闻类稿件多，通知报告类少等样本不均衡的情况，如果对文体不加以区分，会产生少样本文体类别准确率低的情况。[ 方法 / 过程 ] 本文提出一种可以区别文体的深度学习分类模型方法，该方法先根据稿件文体对稿件进行分类，再根据分类结果分别调用分类模型进行进一步分类，解决样本不均衡、小样本文体类别准确率低等问题。[ 结果 / 结论 ] 在公开的数据集上实验结果表示，相对于传统的分类模型，本文提出的多分类模型方法在性能上有了显著提高。]]></description>
<pubDate>2022/6/1 11:25:44</pubDate>
<category><![CDATA[文本信息处理]]></category>
<author><![CDATA[邵德奇，关培培，石聪]]></author>
<guid><![CDATA[http://tie.istic.ac.cn/qbgc/ch/reader/view_abstract.aspx?file_no=202202004&flag=1]]></guid><cfi:id>1</cfi:id><cfi:read>true</cfi:read></item>
</channel>
</rss>