客观日本

“翻译银行”开始运营--日本总务省和NICT

2017年09月19日 信息通信

--为进一步提高自动翻译系统的高精度化汇集各领域翻译数据

日本总务省和国立研究开发法人情报通信研究机构(以下简称NICT)9月8日公布,就发展对应于各领域、高精度化的自动翻译系统,开始运营汇集全日本各体系翻译数据的“翻译银行”。随着社会和经济活动的全球化进程,这一运营将有助于增强日本的国际竞争力。

据总务省和NICT的新闻稿,两者为了推进消除世界语言障碍的全球交流计划,由NICT承担作为其计划之一环的语音翻译(VoiceTra)和文字翻译(TexTra)的研究开发和社会应用。迄目前为止,NICT在累积必要的高精度化的翻译数据的同时,已于2017年6月开始推进了神经机器翻译技术。但是,对于翻译技术应用于各领域还存在翻译数据不足的问题,而“翻译银行”的运营即成为解决这一问题的重要契机。

针对这一课题,总务省和NICT开始运营面向各个领域的翻译数据收集和活用的“翻译银行”。并且,为了提高自动翻译技术的性能,在研究开发中对翻译算法进行了改进。其一是通过“翻译银行”的翻译数据的累积和应用,除了可以扩展自动翻译技术对应的领域之外,还可以实现高精度化。其二是在收集汇总的过程中,确保翻译数据的质和量,这一点至关重要。

Document

图1 “翻译银行”的概念 出处/新闻稿

“翻译银行”在开始运营时,就明确提出为提供数据方提供优惠,即计算NICT的自动翻译技术系统的使用费时,给予适当减免。所以,在计算NICT的自动翻译技术的使用费时,通过导入预期提供的翻译数据来减低费用的机制,使得“翻译银行”建立了良好的循环模式。大家在研发高性能自动翻译技术的同时,亦使得其日后的应用形成了一个良性循环系统。

“翻译银行”目前制定的目标是100万句*100家公司=1亿句的翻译数据的积累。至2017年8月为止,已接受了29个组织提供的数据。

Document

表1 翻译数据例样
(数据提供:Japan Hoppers)

总务省和NICT,通过“翻译银行”的运营,实现各个领域的高精度翻译,消除语言障碍,使日本成为世界上多语言交流最便利的国家,为日本的经济、社会在世界舞台的更加活跃做出贡献。

文/ 客观日本编辑部

相关链接(日语・英语)
(新闻稿)开始运营“翻译银行”
翻译银行主页(英语)