03.27
【World MR News】KDDIが挑戦するXRへの取り組みとは?――「Tech-on MeetUp#05」レポート③
Tech-on ~Networking for Techies~は、3月11日に東京・渋谷のTECH PLAY SHIBUYAで「Tech-on Meet Up #05」を開催した。本稿ではその中から、KDDIの水田修氏によるセッション「XR x ComputerVision」についてレポートする。
VRでいかにコミュニケーションを取るかというところからスタート
KDDIがVR/ARに取り組み始めたのは、2016年の「SXSW2016」からと、キャリアの中でもかなり早いほうだ。当時のVRコンテンツの多くは、ジェットコースターのようなヘッドマウントディスプレイを被って新しい体験ができるというものが多かった。しかし、同社はコミュニケーションカンパニーでもあるため、「コミュニケーション」をVRでいかに取るかというところからスタートしている。
その後、カラオケや漫画喫茶など場所があるところにモバイルでVRを落とし込みビジネスにしてきた。2017年からは、VRやARという切り分けをせずに、新しいことにチャレンジしているという。
最近はXRという言葉を頻繁に耳にするようになってきたが、VRやARといった境界線も曖昧になってきている。VRの機材を使ってAR的な表現をすることもあれば、ARの中にVRのコンテンツが入っているというものもある。そのため、体験というところにフォーカスしてきていると水田氏はいう。
コンピュータビジョン(CV)では、奥行きのデータを画像から取得できるようになってきているなど、単に画像データを見せるだけではなくそこから理解させるというころに進化してきている。そうしたXRとコンピュータビジョンを重ね合わせてできることは、現場の体験価値を上げてコミュニケーションができるものを、新しく作り上げることだと水田氏は考えている。
現在はスマートフォンがARの中心になっているが、そこから取得した画像を元に物体の認識や奥行きの判別ができるほか、今どこにいるかといった情報もおおよそ推定することができる。
それらを元に、現実世界にコンテンツを表示させることで、新しいコミュニケーションが生まれるのである。これまで作れなかった場所にコミュニケーションが作れるようになったのは、リーチが増えてくる部分で着目しているという。
同社が見ているVRのマーケットは、新しい場所に体験価値を作ると言うよりも、「今いる場所で行っていることに対して追加して何ができるか」ということだ。たとえばスポーツ観戦をしているときに、それをどう変えるのか。あるいは、ゲームやエンタメに何を足せばいいのか。このように対応するフィールドは広いため、そこにビジネスチャンスを感じているという。
一方で、コンテンツは共有できないとコミュニケーションは始まらない。歩きスマホはだめだが、メガネのようなデバイスで歩きスマホのように使えるようにするには、法律から変えていく必要があるのだ。
同社では、コンテンツをいかにインタラクティブに作っていくかという部分に対して、サポートする機能を集めていく役割を持ちたいと考えている。コンテンツをクラウドに置くことになったときに、どれだけ通信のレーテンシーを下げることができるのかということも重要となってくる。こうしたことから、KDDIとしてXRに取り組んでいく意味はあると捉えているそうだ。
AI部分は1年間かけて育成
ここから、KDDIが実際に取り組んだ事例が紹介された。ひとつめは、『バーチャルキャラクターガイド』だ。こちらは美術館の中に街の観光コンテンツを写真で飾って、そこを歩いていくとキャラクターが一緒に歩いて案内もしてくれるというものである。
その大元になっているのが、すでにサービスが終了してしまった『おはなしアシスタント』というスマホアプリがベースになっている。スマホの中でアシスタントしていたキャラクターを取り出し、ARの3Dモデルで表示している。
対話はTTSと呼ばれる音声合成を使い、モーションも組み込んで完全なAIで制御を行っている。これらを動作させるシステムは、サーバ側に置いてあるとのこと。ちなみに、クライアント側はUnityベースでアプリを作っており、空間認識はARkitやARcoreを利用している。
こうしたサービスの肝となるのはAIで、常に進化させていく必要がある。そこで必要な機能を、1年間かけて徐々に追加している。
大手町牧場のガイドコンテンツでは、位置情報やマイクと連動して対応するというシンプルなものだった。こうしたものでも、人手が足りないというところでは十分に役にたつことがわかったという。そこで、バーチャルキャラクターの派遣事業も行っている。
次に、特定の位置に来たら自動で翻訳するという機能を追加している。それだけでは自由対話ができないため、多言語の自由対話機能を「CEATEC2018」のタイミングに合わせて実装している。
VRとARの違いでもあるが、ARは年齢が低い子供で利用出来るというのが特徴だ。一方、子供が読めない漢字が使われることがあるという問題もある。そこで、ガイドを体験する前に顔写真を撮影し、年齢を推定して対応できるようにしている。
これにより、場所や年齢、国籍などに応じて案内が出来る本当の意味でのガイドができるようになった。サブカルの国である日本らしく、キャラクターが案内する世界に独自の価値が出てきたのだ。
コンピュータビジョンは、学会の情報をウォッチしていると進化が早いことがわかる。半年前は出来ないと思われていたことが、すぐにできるようになるのだ。そのため、進化することを見越して、拡張できるようにしている。
先ほどの例は観光のガイドを作るところからスタートしているため、地道に作り上げていった。もうひとつの事例である『Character AI』は、人間そのものと作るところから始めている。こちらは常に人の話を聞いて、常に物を見て常時情報をインプットしている。それを理解していきながら、AI自体に感情を持たせてそのときどきの判断をさせるようにしている。
そうすることにより、AIは人間の言うことを聞くという固定概念を覆そうとしている。このアプローチで物を作っていくと、今後何に進化するのか概念実証していく予定だ。
最後に水田氏は、「ぼくらがやろうとしていることは、現実世界を理解したうえで拡張するとコミュニケーションになるということです。この1年でできたことはまだまだチープなものですが、これから拡がっていく範囲もあり、今後は5Gなども登場してきます。アーキテクチャーは、進化する前提で取り組んでいくことが重要で、出来なくともやるというぐらいの根性で、どんどんチャレンジしていく必要があります。そうしないと道も開けず仲間も増えません。同じことを考えている人とは、一緒に取り込んでやっていきたいと思っています」と語りセッションを締めくくった。
Photo&Words 高島おしゃむ
コンピュータホビー雑誌「ログイン」の編集者を経て、1999年よりフリーに。
雑誌の執筆や、ドリームキャスト用のポータルサイト「イサオ マガジン トゥデイ」の
企画・運用等に携わる。
その後、ドワンゴでモバイルサイトの企画・運営等を経て、2014年より再びフリーで活動中。