文章摘要
钱立兵,季振洲.Web搜索引擎的一种检索结构优化方法[J].高技术通讯(中文),2014,24(6):565~572
Web搜索引擎的一种检索结构优化方法
  
DOI:
中文关键词: Web搜索引擎, 分布式搜索, 检索结构, 吞吐量, 分类索引
英文关键词: 
基金项目:
作者单位
钱立兵 哈尔滨工业大学计算机科学与技术学院 
季振洲 哈尔滨工业大学计算机科学与技术学院 
摘要点击次数: 3058
全文下载次数: 2208
中文摘要:
      为了提升Web引擎的检索服务性能和扩展性,提出了一种索引划分方法,依据该方法改进了检索结构,避免了冗余查询,并加速了内部并行化查询过程。按照文档主题和相似URL对索引文档分类,而索引节点内则按照词项划分,实现了索引节点查询间和查询内的并行。根据索引分类的结构,改进了系统内部查询逻辑,设计了Aggregator(简称Agg)进程队列,实现了异步处理高并发查询。实验结果表明,优化的Web引擎结构总体上能够降低查询开销,提高系统吞吐量,相对于传统Web搜索模型,其查询速度和吞吐量分别提高了20%和25%。
英文摘要:
      
查看全文   查看/发表评论  下载PDF阅读器
关闭

分享按钮