文章摘要
梁怀新,郝连旺,宋佳霖,郑存芳,洪文学.基于增量学习和Lasso融合的数据可视化模式识别方法[J].高技术通讯(中文),2018,28(1):39~51
基于增量学习和Lasso融合的数据可视化模式识别方法
  
DOI:
中文关键词: 增量学习, 最小绝对值收缩和选择算子(Lasso), 属性偏序结构图, 可视化, 模式识别, 粒化
英文关键词: 
基金项目:
作者单位
梁怀新  
郝连旺  
宋佳霖  
郑存芳  
洪文学  
摘要点击次数: 2640
全文下载次数: 1877
中文摘要:
      提出了一种基于增量学习和最小绝对值收缩和选择算子(Lasso)特征选择融合的数据可视化模式识别方法。该方法首先对归一化数据进行一级Lasso筛选特征降维,之后对连续数据进行基于Gini指数的粒化,再送入增量模式学习系统进行增量学习,针对维数大量升高的情况进行Lasso二级特征筛选生成一致模式决策表,生成属性偏序结构图可视化规则发现。数据采用来自UCI的5个数据库,并与分类器KNN,SVM,Adaboost,Random Forest进行分类准确度比较,实验表明,基于该算法的分类精度普遍高于其他分类器水平,且属性偏序结构图可视化层次清晰鲜明。通过增量学习实验设计,得到了准确率、图结构更新和不同比例增量数据的动态关系,其中Pima Indians Diabetes数据学习达到40%时准确率(77.66%)超过Adaboost(75.32%)、SVM(77.27%)、1NN(59.74%)、3NN(75.97%)算法。结果表明该算法进行数据的可视化和模式识别是行之有效的。
英文摘要:
      
查看全文   查看/发表评论  下载PDF阅读器
关闭

分享按钮