OpenStack Days Tokyo:ドコモがAIエージェントで得たクラウド活用の知見とは?
クラウドインフラのOpenStackに関するカンファレンス、OpenStack Days Tokyo 2018が開催された。今回の記事では、NTTドコモによるパブリッククラウドを活用した人工知能エージェントに関するセッションを紹介しよう。
「NTTドコモの雲の上に浮かぶAIエージェント戦略」と題されたセッションに登壇したのは、ドコモのイノベーション統括部 クラウドソリューション担当 担当課長の秋永和計氏だ。
秋永氏のセッションは、ドコモが考えるAIエージェントに関するこのようなエピソードの披露から始まった。「今はもう皆さん、覚えてないかもしれませんけど、ドコモって昔はiPhoneを売ってなかったんですよね。2011年ぐらいの時に、ドコモの中で開発されていた音声を使ったAIエージェントをSiriに先駆けて出せと当時の社長に言われたんです」
このように、すでにある程度は技術的なメドはついてはいたものの、それを数ヶ月で市場に出せというのは秋永氏の常識ではありえない、という要求だったのだ。
これは2012年に発表されたドコモの音声認識エージェントである「しゃべってコンシェル(現サービス名はmy daiz)」が作られる過程における話だが、ここでの重要なポイントはそのサービスを立ち上げようとした時に調達部門からは「そんなに急にサーバーを調達できない」と言われたということだ。そのため窮余の決断として、パブリッククラウドサービスを使うようになったという部分だろう。B2Cのインターネットサービスの場合、急激なアクセス増加などに対応するために、数千台規模のサーバーを想定するのが妥当だろう。携帯電話の最大のキャリアとしてドコモは、それぐらいのトラフィックに対する用意を行うのが、社内では常識だったという。ただしそれをたった数ヶ月で全てのサーバーを調達し、設置するというのは非現実的だ。
「当時それを可能にできたのはAmazon Web Serviceだけだった」と秋永氏は語る。そしてここから、ドコモのパブリッククラウドのジャーニーが始まったと言える。さらにいえば、ドコモの要求するサーバーが日本国内には用意できなかったため、サービス提供当初はアメリカ西海岸のAWSデータセンターからサービスを提供していたという。これもレイテンシーを考えればあり得ない話だが、何よりも必要なサーバーを確保するためには必要な選択だった。
この写真は、そのようなサーバーの設置のニーズに応えるために購入したサーバーを設置までの間、置いておくところがなかったために仕方なく通路に置いたという話の証拠写真だ。それぐらいドコモのサービスは、通信サービス向け、コンシューマー向けともに拡大をしていた。ドコモのオンプレミスクラウドはOpenStackで構成されており、そのために大量のサーバーを購入する必要があったというのも頷ける。
このスライドでは、ドコモが稼働させているクラウドの概要が紹介されている。ドコモと言えば、AWSの巨大なユーザーと思われているかもしれないが、実際にはAWS、GCP、Azureの3大パブリッククラウドベンダーを使い分けており、必ずしもAWS一辺倒ではない、ということを強調した。
そして以降は、ドコモが考え実践している音声を使ったAIエージェントの内部に関する解説となった。
ここから分かるのは、ドコモだけの技術として寡占を目指すよりも、エコシステムを形成することを指向しているという点だ。つまり1社で価値を独占するのではなく、プラットフォームとしてオープンにすることで様々な事業者が参加できることを目指していると言える。
しばしば出てくるSiriやAlexaとの違い、オープンな仕様にこだわったこと、AWSだけではなくGCPやAzureに対しても稼働できる柔軟性を備えていること、中核の音声認識の部分は関連会社であるNTTテクノクロスの音声認識エンジンを活用しているということなどを紹介した。音声認識、音声合成に関してはデバイス側、バックエンドのビジネスロジック側の両方をオープンにしており、デベロッパーは自由にシステムに組み込むことが可能であるという。この辺りはAlexaの戦略、デバイス側はメーカーに公開し、バックエンドはスキルと言う名称でアプリケーションを開発できる部分に似ていると言えよう。
特に秋永氏が強調していたのは、合成音声の種類が50種類以上あるという部分だった。
そして競合が多数ひしめく音声エージェントについて、他のインターフェースに対する優位性があること、リアルタイムに反応が可能なこと、日常的に使われること、キャラクター性があることなどを挙げて、これからAIエージェントのエコシステムに参加するプレイヤーに対するヒントを解説した。
そして最後のパートとして、AIエージェントの基盤としてのクラウドについて解説した。以下のスライドはサービスのユーザーが増えても、パブリッククラウドのコストが下がったという例だが、この種明かしは「単純に一番上のでかくて速いインスタンスを選んでしまうんですが、途中で見直しが入ってどんどん最適化されていくことで無駄がなくなった」からだという。
そして社内のエンジニアがクラウドに慣れていくに従って、クラウドならではのことも起こるようになったという。それはエンジニアがコスト意識を無視し、「最も速いインスタンス」を使ってしまうという「クラウドゆとり世代」の誕生だ。
それを抑制するために社内に「CCoE(Cloud Center of Excellence)」と称する横断的な組織を立ち上げて、クラウド利用のガイドラインやテンプレート、情報提供などを行うことにしたことで、コストの抑制、知見の集約、問い合わせへの対応が可能になったという。
この辺りは、部署ごとにクラウドを使っている企業にとってもヒントになるのではないだろうか。また内製によるクラウドコストを可視化するツールなども紹介した。
またサーバーレスにも積極的に取り組んでいることを紹介した。ここでは特に、サーバーレスにすることで圧倒的なコスト削減が可能になったという。
ドコモのクラウド事例は前半のAIエージェントの概要そのものよりも、後半のいかに社内で活用するのか? という辺りがエンタープライズ向けには大いに参考になるものであった。AWSの1社に固定するのではなく、選択の自由を得るために他のクラウドサービスやオープンソースソフトウェアを積極的に使っていく姿勢は、各社とも見習うべき姿勢だろう。
連載バックナンバー
Think ITメルマガ会員登録受付中
全文検索エンジンによるおすすめ記事
- テキストエディタ「GNU nano 3.0」リリース
- テキストエディタ「GNU nano 5.0」リリース
- テキストエディタ「GNU Emacs 26.1」リリース
- テキストエディタ「GNU Emacs 26.1」リリース
- GNU Emacs Project、「GNU Emac 26.3」をリリース
- GNU Emacs Project、「Emacs 27.2」リリース
- GNU Emacs Project、「Emacs 25.1」リリース
- GNU Emacs Project、「Emacs 26.2」リリース
- GNU Emacs Project、「Emacs 27.1」リリース
- 仮想ターミナルで動作できるテキストエディタ「Micro 1.0.2」リリース