融入翻译记忆库的法律领域神经机器翻译方法*
所属分类:技术论文
上传者:zhoubin333
文档大小:3666 K
标签: 神经机器翻译 语义信息 结构信息
所需积分:0分积分不够怎么办?
文档介绍:面向法律领域的神经机器翻译对于合同文本翻译等应用场景具有重要价值。由于法律领域双语对齐语料稀缺,翻译效果还不理想。针对该问题,目前有效的方法是融入翻译记忆或翻译模版等外部信息,但法律领域的文本多具有固定的表达结构且用词准确规范,在翻译记忆库中同时利用翻译结构信息和语义信息能够进一步提升法律领域翻译性能。基于此,提出一种融入翻译记忆库的法律领域机器翻译方法。提出了一种新的法律领域翻译记忆库,首先基于语义和结构信息的相似性训练跨语言检索模型以充分利用单语数据,然后从翻译记忆库中检索与输入源句相关的一组翻译记忆和翻译模版,进而引导翻译模型生成目标句子。实验表明,在MHLAW数据集上,提出的方法可以使译文较基线模型提升1.28个BLEU点。
现在下载
VIP会员,AET专家下载不扣分;重复下载不扣分,本人上传资源不扣分。