文章摘要
何中军,刘群,林守勋.基于短语相似度的统计机器翻译模型[J].高技术通讯(中文),2009,19(4):337~341
基于短语相似度的统计机器翻译模型
  
DOI:
中文关键词: 相似度,基于短语的统计机器翻译,基于实例的机器翻译
英文关键词: 
基金项目:
作者单位
何中军 中国科学院计算技术研究所中国科学院智能信息处理重点实验室;中国科学院研究生院 
刘群 中国科学院计算技术研究所中国科学院智能信息处理重点实验室 
林守勋 中国科学院计算技术研究所中国科学院智能信息处理重点实验室 
摘要点击次数: 3020
全文下载次数: 0
中文摘要:
      针对基于短语的统计机器翻译(SMT)模型中由于采用精确匹配策略导致的短语稀疏问题,提出了一种基于短语相似度的统计机器翻译模型。该模型将基于实例的翻译方法引入到统计机器翻译中。翻译时,对于训练语料库中未出现过的短语,通过计算源语言短语之间的相似度,采用模糊匹配策略从短语表中查找相似的实例短语,并根据实例短语为其构造翻译。与精确匹配策略相比,利用相似度进行模糊匹配增加了对短语表的利用程度,缓解了短语稀疏问题。实验表明,该模型能够明显地提高统计机器翻译的质量,效果超过了当前最好的短语系统“摩西(Moses)”。
英文摘要:
      
查看全文   查看/发表评论  下载PDF阅读器
关闭

分享按钮