钱立兵,季振洲.Web搜索引擎的一种检索结构优化方法[J].高技术通讯(中文),2014,24(6):565~572 |
Web搜索引擎的一种检索结构优化方法 |
|
|
DOI: |
中文关键词: Web搜索引擎, 分布式搜索, 检索结构, 吞吐量, 分类索引 |
英文关键词: |
基金项目: |
作者 | 单位 | 钱立兵 | 哈尔滨工业大学计算机科学与技术学院 | 季振洲 | 哈尔滨工业大学计算机科学与技术学院 |
|
摘要点击次数: 3042 |
全文下载次数: 2197 |
中文摘要: |
为了提升Web引擎的检索服务性能和扩展性,提出了一种索引划分方法,依据该方法改进了检索结构,避免了冗余查询,并加速了内部并行化查询过程。按照文档主题和相似URL对索引文档分类,而索引节点内则按照词项划分,实现了索引节点查询间和查询内的并行。根据索引分类的结构,改进了系统内部查询逻辑,设计了Aggregator(简称Agg)进程队列,实现了异步处理高并发查询。实验结果表明,优化的Web引擎结构总体上能够降低查询开销,提高系统吞吐量,相对于传统Web搜索模型,其查询速度和吞吐量分别提高了20%和25%。 |
英文摘要: |
|
查看全文
查看/发表评论 下载PDF阅读器 |
关闭 |
|
|
|