侯伟,杨炳儒,吴晨生,周谆.基于周期采样的数据流频繁项集挖掘算法研究[J].高技术通讯(中文),2009,19(8):817~824 |
基于周期采样的数据流频繁项集挖掘算法研究 |
|
|
DOI: |
中文关键词: 数据挖掘,数据流,频繁项(FI)集,周期采样(PS) |
英文关键词: |
基金项目: |
作者 | 单位 | 侯伟 | 北京科技大学信息工程学院 | 杨炳儒 | 北京科技大学信息工程学院 | 吴晨生 | 北京市科学技术情报研究所 | 周谆 | 北京科技大学信息工程学院 |
|
摘要点击次数: 2940 |
全文下载次数: 2194 |
中文摘要: |
针对用于数据流频繁项集挖掘的现有方法存在引入过多次频繁项集以及时空性能与输出精度较低的问题,利用Chebyshev不等式,构造了项集频度周期采样的概率误差边界,给出了动态检测项集支持度变化方法。提出了一种基于周期采样的数据流频繁项集挖掘算法FI PS,该算法通过跟踪项集支持度变化确定项集支持度的稳定性,并以此作为调整窗口大小以及采样周期的依据,从而以一个较大的概率保证项集支持度误差有上界。理论分析及实验证明该算法有效,在保证挖掘结果准确度相对较好的条件下,可获得较优执行性能。 |
英文摘要: |
|
查看全文
查看/发表评论 下载PDF阅读器 |
关闭 |
|
|
|