崔甲,王伟平,陈重韬,孟 丹.基于滑动窗口的数据流字符串近似查询[J].高技术通讯(中文),2014,24(9):895~902 |
基于滑动窗口的数据流字符串近似查询 |
|
|
DOI: |
中文关键词: 数据流, 字符串近似查询, 滑动窗口, 编辑距离 |
英文关键词: |
基金项目: |
作者 | 单位 | 崔甲 | 中国科学院计算技术研究所计算机应用研究中心;中国科学院大学;中国科学院信息工程研究所 | 王伟平 | 中国科学院计算技术研究所计算机应用研究中心;中国科学院大学 | 陈重韬 | 中国科学院计算技术研究所计算机应用研究中心;中国科学院大学;中国科学院信息工程研究所 | 孟 丹 | 中国科学院信息工程研究所 |
|
摘要点击次数: 3244 |
全文下载次数: 2402 |
中文摘要: |
针对数据访问模式随着网络技术的发展逐渐从静态磁盘转移到动态数据流的状况,研究了数据流上的字符串近似查询。为了解决数据流的连续性、无边界性、不可预知性和在线计算资源的局限性导致基于静态数据集的近似查询处理方法无法高效地支持数据流的问题,提出了基于滑动窗口数据流的字符串近似查询(AS3)方法。该方法基于过滤 验证框架和基本窗口索引更新机制,改进并应用非对称特征策略提取数据流和查询关键字的特征,采用了两个新的过滤算法——预剪裁过滤(PPF)算法和流统计(CFS)过滤算法,以及基于矩阵坐标的验证(CV)算法。实验结果表明,AS3方法能够高效地支持基于滑动窗口的数据流字符串近似查询,在保证结果准确率的同时具有较高的实时性及峰值处理能力。 |
英文摘要: |
|
查看全文
查看/发表评论 下载PDF阅读器 |
关闭 |
|
|
|