客观日本

利用AI超高精度合成歌声,走进“以假乱真”的时代

2018年12月21日 机械/机器人
日本语

名古屋工业大学国际声音语言技术研究所与日本的Techno Speech公司(https://www.techno-speech.com/)共同开发了能以前所未有的高精度再现人的声音特质、习惯和演唱方式的歌声合成技术。

利用AI超高精度合成歌声,走进“以假乱真”的时代

名古屋工业大学与Techno Speech此前就一直在研发声音合成和歌声合成技术,已经为商用卡拉OK设备“JOYSOUND”和声音创作软件“CeVIO Creative Studio”等导入了声音合成及歌声合成技术。此次两家的研发人员针对特定歌手的约2小时歌声数据库,利用深度学习等AI技术学习了歌手的声音特质、习惯和演唱方式。合成时仅输入带歌词的标准乐谱,即可合成出高品质的歌声。

利用此次开发的技术,可以在娱乐、教育和医疗等多个领域进一步丰富人们的生活,比如再现艺术家(包括已故艺术家)的歌声、乐曲制作和游戏开发、具有人工智能和语音对话系统的发声模块、在外语教育和歌唱教育中生成灵活的参考声音、为渐冻症和喉癌患者提供发声器件等。

支持语言:日语、英语、中文
合成音频样本:新技术(伴奏、清唱)、现行技术(清唱)
输入:未进行人为调整的纯文本歌词乐谱

利用AI超高精度合成歌声,走进“以假乱真”的时代

音频样本:[网址]

※歌曲数据库提供者
日语:CeVIO项目“SatoSasara” [网址]
英语:1st PLACE公司“IA”(Voice source: Lia) [网址]

文:JST客观日本编辑部

日文发布全文 [PDF]