基于短语相似度的统计机器翻译模型

何中军; 刘群; 林守勋

文章摘要

何中军,刘群,林守勋.基于短语相似度的统计机器翻译模型[J].高技术通讯(中文),2009,19(4):337~341

基于短语相似度的统计机器翻译模型

DOI：

中文关键词: 相似度，基于短语的统计机器翻译，基于实例的机器翻译

英文关键词:

基金项目:

作者	单位
何中军	中国科学院计算技术研究所中国科学院智能信息处理重点实验室；中国科学院研究生院
刘群	中国科学院计算技术研究所中国科学院智能信息处理重点实验室
林守勋	中国科学院计算技术研究所中国科学院智能信息处理重点实验室

摘要点击次数: 6017

全文下载次数: 0

中文摘要:

针对基于短语的统计机器翻译(SMT)模型中由于采用精确匹配策略导致的短语稀疏问题，提出了一种基于短语相似度的统计机器翻译模型。该模型将基于实例的翻译方法引入到统计机器翻译中。翻译时，对于训练语料库中未出现过的短语，通过计算源语言短语之间的相似度，采用模糊匹配策略从短语表中查找相似的实例短语，并根据实例短语为其构造翻译。与精确匹配策略相比，利用相似度进行模糊匹配增加了对短语表的利用程度，缓解了短语稀疏问题。实验表明，该模型能够明显地提高统计机器翻译的质量，效果超过了当前最好的短语系统“摩西(Moses)”。

英文摘要:

查看全文查看/发表评论下载PDF阅读器

关闭