基于文本挖掘的交互式专利分类

张晓宇

文章摘要

张晓宇.基于文本挖掘的交互式专利分类[J].高技术通讯(中文),2013,23(6):592~597

基于文本挖掘的交互式专利分类

DOI：

中文关键词: 文本挖掘，专利分类，多分类器融合，主动学习，选择性采样

英文关键词:

基金项目:

作者	单位
张晓宇	中国科学技术信息研究所

摘要点击次数: 3553

全文下载次数: 2686

中文摘要:

将文本挖掘理论应用于专利信息分析，提出了一种基于多分类器融合与主动学习的交互式专利分类算法，旨在实现高效的专利分类。该算法基于训练集，利用支持向量机，针对不同的专利类别分别训练相应的子分类器，然后通过多分类器融合对各子分类器进行有机结合，以获得性能更优的分类器和形成分类决策。在此基础上，利用主动学习选取最有信息的样本进行标引，从而通过人机交互实现分类模型的更新。针对传统批量选择性采样的缺点，还提出了动态批量选择性采样模式，通过确定度传播策略有效降低标引样本冗余度，以进一步提高主动学习的效率。实验结果表明，这种基于多分类器融合与主动学习的交互式专利分类算法的分类性能显著高于其他算法。

英文摘要:

查看全文查看/发表评论下载PDF阅读器

关闭