AIによる画像生成、ついに「3D」が当たり前の時代がやってくる!
「Stable Diffusion(ステーブル・ディフュージョン)」や「Midjourney(ミッドジャーニー)」をはじめ、画像生成AIが普及しはじめ、誰もが簡単に高品質な画像を生み出せるようになった。
その流れはいよいよ、3Dへ──。
「Google Research」と米「UC Berkeley」の研究チームが、3Dのデータ生成を行うAIの開発に関する論文を発表した。
入力されたテキストの画像生成においては、数十億もの画像とテキストのペアを学習させた拡散モデルによって飛躍的に進歩してきた。
これを3Dに応用するには、ラベリングされた3Dアセットの大規模なデータセットと3Dデータのノイズ除去を可能とする効率的なアーキテクチャが必要とされるが、どちらも現状存在してはいない。
だが、今回発表された「DreamFusion」なる手法は、上記の制約を回避し、事前に画像のみで学習した拡張モデルを用いてテキストから3次元への合成を選択するというもの。
これにより、忠実度の高い3Dオブジェクトを生成し、任意の角度からそれを眺めたり、環境に合成などが可能となる。
現状、3D生成されたオブジェクトはディティールに欠けるが、それを解消することで膨大な時間がかかってしまうとみられる。今後、いかに効率化を図るかが課題となるだろう。
画像生成AIは我々に表現とはなにか?を突きつけているが、3D生成AIが我々に迫るものは一体何だろうか。
© Ai Flux / YouTube
Reference: DreamFusion: Text-to-3D using 2D Diffusion
Top image: © iStock.com/imaginima