李铭,张克亮,唐亮,夏榕璟.多引擎机器翻译译文重排序与融合研究[J].情报工程,2023,9(2):096-107 |
多引擎机器翻译译文重排序与融合研究 |
A Study of Re-ranking and Combination for Multi-engine Machine Translation |
|
DOI:10.3772/j.issn.2095-915X.2023.02.009 |
中文关键词: 多引擎机器翻译;译文重排序;译文融合 |
英文关键词: Multi-engine machine translation; Translation re-ranking; Translation combination |
基金项目: |
作者 | 单位 | 李铭 | 战略支援部队信息工程大学 洛阳 471003 | 张克亮 | 战略支援部队信息工程大学 洛阳 471003 | 唐亮 | 战略支援部队信息工程大学 洛阳 471003 | 夏榕璟 | 战略支援部队信息工程大学 洛阳 471003 |
|
摘要点击次数: 803 |
全文下载次数: 712 |
中文摘要: |
[ 目的 / 意义 ] 使用不用的模型、方法、语种、数据构建的机器翻译引擎往往在不同的场景下具有不同的翻译效果。因此,很多研究者都在构建机器翻译引擎时尝试使用多引擎译文融合或多翻译方法融合的方式来利用不同翻译引擎的优点,然而过往的工作没有考虑到如何利用用户在使用多引擎机器翻译所产生的数据来获取存在于用户认知域中对这些引擎译文的评价。[ 方法 / 过程 ] 本文研究提出了基于六个翻译引擎的多引擎翻译平台。该平台在长期使用中产生了翻译结果、用户特征、人工校译等数据,本文基于以上大规模历史数据构建了翻译模型训练资源库,结合 Page Rank 算法、贝叶斯公式和 UNQE 方法提出了多引擎机器翻译译文重排序方法,并利用译文重排序的结果与翻译模型训练资源库中的翻译实例相关数据,进一步使用 Transformer 架构训练了译文融合模型。[ 局限 ] 所提方法存在冷启动问题,需要一定时间、大量用户的真实数据才能够实现预期效果。[ 结果 / 结论 ] 实验结果表明了本文提出的方法能够融合多引擎优势,提高不同领域的平均译文质量 |
英文摘要: |
[Objective/Significance] Machine Translation (MT) engines trained with different models, methods, language and data have different performance for multiple specific translation scenario. Thus, a number of research tried to use multi-engine or multi-method combination approach for constructing MT system with advances of each MT engine. [Methods/Processes] This research provides a multi-engine platform with six different MT engines. During the long-term using of it, there comes a huge amount of data of translation instances, user profiles and human translates. A resource warehouse for translation model training is constructed using these data. we offer a method of multi-engine MT re-ranking using the resource warehouse with Page Rank Algorithm, Bayes Rule and UNQE. Furthermore, we use the result generated by the re-ranking method with human translations provided by the resource warehouse to train a translation combination model. [Limitations] This Method has cold boot problem which requires data generated within a period of time and by a number of users to reach our goals. [Results/Conclusions] The test result shows the method we provide can use advantages of multiple MT engines and improve translation eventually. |
查看全文
查看/发表评论 下载PDF阅读器 |
关闭 |