2021年、AIの声はここまで進化……！

2021/09/11

TABI LABO編集部

先日は、英ソフトウェア会社「Sonantic」が名優ヴァル・キルマーの声をAIで復元したことをお伝えしたが、今度は米GPUメーカーの「NVIDIA」が最新のAI音声に関する最新のテクノロジーを発表。

9月3日まで開催されている音声処理に関するカンファレンス「Interspeech 2021」で展示されているプロジェクトは、AIによる合成音声に関する複数のソフトウェアを利用して、架空の音声を創造するというもの。

その驚愕のテクノロジーに関して、まずは以下の動画を観て欲しい。

このプロジェクトで主に使われているのは、NVIDIAのテキスト読み上げ研究チームが開発し、放送事業者の大会「NAB Show」のコンペで優勝したシステム「RAD-TTS」。

この高度なソフトウェアは、AIが発話のテンポや調性、音色を学習することに加えて、なんと人間が学習させることができる。

例えば、ある声優の声をAIに覚えさせたあとに、その声優の助けを必要とすることなく、全く違ったトーンを喋らせたり、あるいは歌を歌わせることができるというのだ。

NVIDIAが、「プロデューサーはAIを声優のようにディレクションすることができます」と語るように、これはもしかすると声優泣かせになるかもしれない技術。

テクノロジーの進化は嬉しいが、この技術は今後のコンテンツ制作に大きな影響を与えるかもしれない。