郑铁然,韩纪庆.基于后验概率的汉语语音检索方法研究[J].高技术通讯(中文),2009,19(2):119~124 |
基于后验概率的汉语语音检索方法研究 |
|
|
DOI: |
中文关键词: 汉语语音检索, 音节lattice, 后验概率, 检索模型, 邻接矩阵 |
英文关键词: |
基金项目: |
作者 | 单位 | 郑铁然 | 哈尔滨工业大学计算机科学与技术学院 | 韩纪庆 | 哈尔滨工业大学计算机科学与技术学院 |
|
摘要点击次数: 3003 |
全文下载次数: 2333 |
中文摘要: |
针对经典的向量空间检索模型直接用于基于音节lattice形式的汉语语音检索存在无法有效区分lattice中包含的正确音节识别候选和错误的识别候选以及不能充分利用lattice中所蕴含的各层级信息的不足,提出了一种基于语音文档邻接音节后验概率矩阵的检索方法。该方法以该矩阵作为文档索引,并计算查询请求被包含在语音文档中的后验概率,并以此来度量查询请求和语音文档间的相关度。后验概率作为可靠的置信测度能够有效区分正确和错误的音节候选,在lattice中后验概率的计算能够充分地利用语音识别结果中的多层级的信息。语音检索实验表明,与基于向量空间模型的检索方法相比,该方法的检索性能有显著提高,是一种适用于汉语语音检索的有效方法。 |
英文摘要: |
|
查看全文
查看/发表评论 下载PDF阅读器 |
关闭 |
|
|
|