<?xml version="1.0" encoding="utf-8"?>
<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom" xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005">
<channel xmlns:cfi="http://www.microsoft.com/schemas/rss/core/2005/internal" cfi:lastdownloaderror="None">
<title cf:type="text"><![CDATA[《情报工程》编辑部 -->文本分析]]></title>
<item>
<title xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="text"><![CDATA[基于关键特征增强的金融长文本事件分类]]></title>
<link><![CDATA[http://tie.istic.ac.cn/qbgc/ch/reader/view_abstract.aspx?file_no=202403008&flag=1]]></link>
<description xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="html"><![CDATA[[目的/意义]为了解决长文本模型输入长度限制问题，通过抽取事件关键句和事件关键词，对长文本进行关键特征增强，以提高模型的特征表示能力。[方法/过程]基于关键特征增强的模型，在原文的基础上利用TextRank算法抽取事件关键句，并利用TF-IDF算法抽取事件关键词，将二者作为关键特征对长文本进行特征增强，再利用BERT和Self-Attention模型进行特征的进一步提取，最后进行事件分类。[局限]模型仅在金融领域事件分类上进行实验，可以考虑在其他领域内也进行实验并进一步验证模型效果。[结果/结论]在金融长新闻事件分类数据集上，提出的模型准确率达到88.40%，比基准模型提升了2个以上的百分点，表明了模型的有效性。]]></description>
<pubDate>2024/9/6 10:12:01</pubDate>
<category><![CDATA[文本分析]]></category>
<author><![CDATA[王洁，李旭晖]]></author>
<guid><![CDATA[http://tie.istic.ac.cn/qbgc/ch/reader/view_abstract.aspx?file_no=202403008&flag=1]]></guid><cfi:id>2</cfi:id><cfi:read>true</cfi:read></item>
<item>
<title xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="text"><![CDATA[基于教材文本语料库的自适应主题词表构建——以经济类专业为例]]></title>
<link><![CDATA[http://tie.istic.ac.cn/qbgc/ch/reader/view_abstract.aspx?file_no=202403009&flag=1]]></link>
<description xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="html"><![CDATA[[目的/意义]构建一套面向汉语非母语学习者的专业词表对专业学习和国际中文教育学科建设及发展具有重要意义。[方法/过程]针对当前外向型专业词表较少及构建方法单一问题，本文首先从网站爬取小说、新闻和论坛留言构建参照语料库，根据教育部专业课程设置目录，选取专业教材构建专业教材语料库，运用TF-IDF-TF算法遴选专业主题词并构建词共现矩阵，利用凝聚聚类法实现专业主题词聚类。在此基础上，计算词簇内主题词的语义相关性，选取语义共现度最大的词作为词簇中心词，并根据语义相关性编排词表。最后，以经济学类专业为例构建面向留学生的专业主题词表。[结果/结论]结果表明，本文构建的经济类专业主题词表能够较好地提取专业词汇且有效地将语义关联度紧密的专业主题词聚类在同一词簇内，学习者能够快速有效获取相关词簇进行专业自适应学习，并为其他专业主题词表的构建提供了依据。]]></description>
<pubDate>2024/9/6 10:12:01</pubDate>
<category><![CDATA[文本分析]]></category>
<author><![CDATA[杭建琴，张鸣宇，胡泽文]]></author>
<guid><![CDATA[http://tie.istic.ac.cn/qbgc/ch/reader/view_abstract.aspx?file_no=202403009&flag=1]]></guid><cfi:id>1</cfi:id><cfi:read>true</cfi:read></item>
</channel>
</rss>