何中军,刘群,林守勋.基于短语相似度的统计机器翻译模型[J].高技术通讯(中文),2009,19(4):337~341 |
基于短语相似度的统计机器翻译模型 |
|
|
DOI: |
中文关键词: 相似度,基于短语的统计机器翻译,基于实例的机器翻译 |
英文关键词: |
基金项目: |
作者 | 单位 | 何中军 | 中国科学院计算技术研究所中国科学院智能信息处理重点实验室;中国科学院研究生院 | 刘群 | 中国科学院计算技术研究所中国科学院智能信息处理重点实验室 | 林守勋 | 中国科学院计算技术研究所中国科学院智能信息处理重点实验室 |
|
摘要点击次数: 3020 |
全文下载次数: 0 |
中文摘要: |
针对基于短语的统计机器翻译(SMT)模型中由于采用精确匹配策略导致的短语稀疏问题,提出了一种基于短语相似度的统计机器翻译模型。该模型将基于实例的翻译方法引入到统计机器翻译中。翻译时,对于训练语料库中未出现过的短语,通过计算源语言短语之间的相似度,采用模糊匹配策略从短语表中查找相似的实例短语,并根据实例短语为其构造翻译。与精确匹配策略相比,利用相似度进行模糊匹配增加了对短语表的利用程度,缓解了短语稀疏问题。实验表明,该模型能够明显地提高统计机器翻译的质量,效果超过了当前最好的短语系统“摩西(Moses)”。 |
英文摘要: |
|
查看全文
查看/发表评论 下载PDF阅读器 |
关闭 |
|
|
|