王继民,李雷明子,孟涛.Web搜索引擎日志挖掘研究框架[J].数字图书馆论坛,2011,(8):25~31 |
Web搜索引擎日志挖掘研究框架 |
A Research Framework of Web Search Engine Usage Mining |
|
DOI: |
中文关键词: 搜索引擎;用户日志;Web使用挖掘;用户搜索行为 |
英文关键词: Search engine, User log, Web usage mining, User search behaviors |
基金项目:本研究得到国家社会科学基金(10BTQ050),教育部人文社会科学基金(09YJA870002)和核高基项目(2011ZX01042-001-001)的资助. |
作者 | 单位 | 王继民 | 北京大学 | 李雷明子 | 北京大学 | 孟涛 | 北京大学 |
|
摘要点击次数: 2048 |
全文下载次数: 1422 |
中文摘要: |
搜索引擎日志记录了用户与系统交互的整个过程.对日志文件进行挖掘,可以发现用户进行Web搜索的行为特征与规律,有效改善搜索引擎系统的性能.在对国内外相关研究进行系统梳理和总结的基础上,文章提出了一个Web搜索引擎日志挖掘的研究框架,主要包括日志挖掘的研究内容、数据集的选择方法、数据预处理的方法、不同地域用户行为的特征与比较、如何应用于系统性能的改善等内容. |
英文摘要: |
Log files of search engines record the interactive procedure between users and the system completely. Mining the logs can help us to discover the characteristics of user behaviors and to improve the performance of search systems. This paper gives a framework on Web search engine usage mining, which includes the choice of data collections, the methods of data preprocessing, and an analysis and comparison of search behaviors from different countries. We also explore its applications on improving the effectiveness and efficiency of search engines. |
查看全文
查看/发表评论 下载PDF阅读器 |
关闭 |
|
|
|