人工知能が「読唇術」で会話をテキスト化。正解率は93.4%。
英・オックスフォード大学の研究チームが発表した研究結果によれば、人工知能によって、唇の動きから会話の内容を文章レベルで認識できる機能が実現しました。
これまでは、読唇術のプロでさえその正解率は52.3%ほどでした。ところが、このLIPREADINGと呼ばれる機能なら、93.4%もの確率で正しい会話の内容を読み取ることができます。
相手の「話」が、目で見えるようになる。
![](https://d2ygv0wrq5q6bx.cloudfront.net/uploads/image/files/60773/8e1265cfa098a1d0547498ca1a8459b4af06ba1a.gif)
![](https://d2ygv0wrq5q6bx.cloudfront.net/uploads/image/files/60774/0accbd76b7b75d0a4ee0a50ae06d00a897d0805c.gif)
相手が何を話しているのかを上の動画のようにして理解できれば、まるでチャットをするかのようにして会話を読解できるようになります。スマホやスマートグラスを併用した視覚的コミュニケーションや音声入力の精度向上も期待されているようです。
日本語への対応がいつになるのか、気になりますね。
Licensed material used with permission by University of Oxford