张长海,胡孔法,陈,宋爱波.一种高效的基于位图序列模式挖掘算法[J].高技术通讯(中文),2010,20(2):133~137 |
一种高效的基于位图序列模式挖掘算法 |
An improved sequential pattern mining algorithm based on bitmaps |
|
DOI: |
中文关键词: 数据挖掘, 序列模式, 位图 |
英文关键词: data mining, sequential patterns, bitmap |
基金项目:国家自然科学基金(60773103,60673060),江苏省自然科学基金(BK2009697,BK2008206),江苏省教育厅自然科学基金(08KJB520012),江苏省“六大人才高峰”基金和江苏省“青蓝工程”基金资助项目 |
作者 | 单位 | 张长海 | 扬州大学信息工程学院 | 胡孔法 | 扬州大学信息工程学院 东南大学计算机科学与工程学院 | 陈 | 扬州大学信息工程学院 | 宋爱波 | 东南大学计算机科学与工程学院 |
|
摘要点击次数: 3526 |
全文下载次数: 2372 |
中文摘要: |
为实现在大型事务数据库中挖掘有价值的序列数据,提出了一种基于位图的高效的序列模式挖掘算法(SMBR)。SMBR算法采用位图表示数据库的方法,提出一种简化的位图表示结构。该算法首先由序列扩展和项扩展产生候选序列,然后通过原序列位图和被扩展项位图位置快速运算生成频繁序列。实验表明,应用于大型事务数据库,该方法不仅能有效地提高挖掘效率,而且挖掘处理过程中产生的临时数据所需的内存大大降低,能够高效地挖掘序列模式。 |
英文摘要: |
For mining valuable sequence data in large transaction databases, the paper proposes an algorithm for sequential pattern mining based on bitmap representation (SMBR). The SMBR algorithm uses bitmaps to represent databases, and presents a simplified bitmap structure. First the algorithm generates candidate sequences by sequence extension (SE) and item extension (IE), and then obtains all frequent sequences by comparing the original bitmap and the extended item bitmap. The experiments show that when using the algorithm in large transaction databases the required memory size for storing temporal data during mining process is greatly decreased, and all sequential patterns can be efficiently mined. |
查看全文
查看/发表评论 下载PDF阅读器 |
关闭 |
|
|
|