PR
この連載が書籍になりました!『エンジニアのためのAI入門

AI最前線の現場から【ietty】オンライン接客型人工知能の未来

2016年11月30日(水)
大浜 毅美

2016年はチャットボット元年

2016年もそろそろ終わりに近づいています。改めて振り返ると、今年は年初から言われていた「チャットボット元年」と呼ぶにふさわしい年となったといえるかと思います(原稿執筆は2016年11月です)。

3月にMicrosoft、4月にLINE、Facebookが相次いでbotのためのAPIやプラットフォームを発表し、秋にはそれぞれ正式版リリースやアップデートが行われ、それらを利用したbotが相次いで公開されました。Microsoftによる「Tay」のリリースとその不適切発言による一時停止、女子高生AI「りんな」のテレビ出演なども話題になっています。

下図はGoogle トレンドによる「チャットボット」というキーワードの推移ですが、3月ごろから盛り上がりを見せ、7月にバーストし、そこから現在までなにかしら話題が出ている状態が続いていることが見て取れます。

Google トレンドにみる「チャットボット」人気度の推移

また、チャットボットを支える人工知能分野でも「AlphaGO」の韓国トップ囲碁プレーヤーとの対戦とその勝利やIBM Watsonによるがん患者の診断についてなど、この分野のブレイクスルーを実感させる数多くのリリースがありました。

チャットとチャットボット-古くて新しい技術

コンピュータが人間と対話する「チャットボット」という仕組は、1960年代の「ELIZA」をはじめ、1990年代には日本でも「ゆいぼっと」などのいわゆる「人工無脳」と呼ばれるボットが稼働しています。これらは「チャットボット」とは言わないまでも技術スキームはほぼ同様のもので、チャットシステム上で機械が人間と会話していました。

また、チャットボットの活動の場「チャット」システムもアイデアそのものはかなり古く、1950年代にはすでにその原型があり、パソコン通信、Webチャット、インスタントメッセンジャーなど様々なアプローチで脈々と続いています。

もちろん、チャットが一般の消費者に広く知られると言えるところまで浸透したのはLINE、Facebook Messenger、WhatsAppなどが爆発的に普及した2011年頃からで、ボットもTwitter botこそ2007年頃から稼働していますが多くは一方的につぶやくのみで、「対話」できるチャットボットはSiri(チャットボットの概念から少し外れていますが)やりんな以降になるかと思います。

とはいえ、こうした取り組みもやはり最近までは研究やゲーム、個人間コミュニケーションといった性格が強く、ビジネス利用までを視野に入れた実用的なチャットおよびチャットボット、という意味では2016年にやっとそれらを立ち上げるための要素技術が出そろってきた、という感があります。

ビジネス・チャットボットの住まいを考える

チャットボットの住まい

では、このチャットボットが来年、再来年にはどのような進化をたどるのでしょうか。また、このチャットボットの「住まい」、つまりチャットとそれを取り巻くシステムは今後どのようになっていくのでしょうか。

利用分野

これまで同様、研究目的や娯楽(ゲーム)、個人間コミュニケーションでの利用は増加していくでしょう。加えて今年発表されたAPIを用いたビジネスシーンでの利用が加速していくこともほぼ間違いありません。また教育、医療、転職市場などとも親和性が高く、すでに多くのサービスが公開されています。私たちiettyが手掛ける不動産領域をはじめ、自動車販売、ファッション、保険商品なども可能性の高い分野の1つです。

今のところはまだ準備段階かクイックにやってみた、といったレベルのところも多いですが、これらが整備されてくると、これまでのITやEコマースではカバーしきれなかった「対話」を必要とするビジネスでの活用も本格的になってくるでしょう。

対話技術

さらに、この対話がより自然に「会話のキャッチボール」ができるようになることが期待されます。これまでのチャットボットは一問一答型が多く、ある質問にほぼ固定の答えを返す種類のものがほとんどでした。

情報技術領域では、入力から結果までが1セットで完結し状態を保持しない通信を「ステートレス」、対話のように以前の状態を保持し内容によって反応が変わる方式を「ステートフル」と呼びます。従来のWebサイトやフォーム要素、検索などはクリックや文字入力といった1つのアクションで1つの回答が返ってくるステートレスであるのに対し、ゲームやチャットシステムの多くはステートフルに分類されます。

これまでインターネットや情報技術は構築の単純さや結合を疎にしやすいなどの理由からステートレスな技術・サービスが大きなウエイトを占めていました。もちろん、サービスを成長させ、多くの人が利用できるようにするためにはステートレスな技術のほうが有利な点も多く、今後もそうしたアプローチが否定されるわけではありません。

しかし、人間の意識・行動やコミュニケーションは本質的にステートフルです。 ボットと人の協調

人間同士の会話でそれまでの話の流れを意識しないで発言することはほぼ不可能ですし、代名詞、指示語の使用やその省略といった、事前知識を前提とした発言の構成も当たり前に行われています。1つ1つはスレートレスな技術でも状態を管理する別の仕組みが必要であり、例えばWebではCookieやSessionがこれらを担っていましたが、これらはあくまでも「箱」であり、その中身をどうするかは開発者の実装に任されていました。

現在、こうした状態管理の研究・実装が盛んに行われており、例えばMicrosoftのBot FrameworkやIBMのWatson Developer Cloudにはこうした「状態管理」のためのAPIが用意されていますし、自身で開発する場合もマルコフ決定過程に基づく強化学習的なアプローチが使われるケースも出てきており、こうした分野でもブレイクスルーが起こる準備が整ってきています。

さらにチャットシステムではこれまで文字チャットなら文字とせいぜい画像やスタンプのみを、音声チャットなら音声のみをやり取りするインターフェイスが主流でしたが、LINE、Facebookともボタンインターフェイスやカルーセル、選択肢等、多彩なUIを絵や文字と同時に提示できるようなAPIが相次いで発表されており、こうした方面でも進化の兆しが見られます。UberのChris Messina氏やMicrosoftのSatya Nadella CEOがチャットボットを「大きなパラダイム・シフトである」と唱えているのは、こうした流れがステート(状態)に対するインターネットのこれまでの常識を根底から変えてしまう可能性を秘めているからこそではないでしょうか。

ボット・オーケストレーション

ボットと人の協調

単体のチャットボットが自然に人と対話できるようになってくると、次に異なる個性を持つ複数のbotが協調して活動する場が求められます。どんな内容の質問にも応えられる人工知能、いわゆる汎用人工知能(AGI:Artificial General Intelligence)の研究も見直されつつあり、人工知能の知性が人間を超えることによって起こると言われる「シンギュラリティ」についての議論も注目を浴びています。

しかし、現状では近い将来ビジネスに利用できるというレベルで実現される見込みはなく、チャットボット内の人工知能に限っていえば利用者は人間で、相手も人間らしい会話ができることが目標なので、ある意味「人間を超えて」しまっては本末転倒です。

また、特にビジネスシーンでは1つのチャットスペースに複数のボットとチャットオペレータ(人間)が同時に対応できるスキームも必要になります。今のところチャットボット、つまり機械応答だけですべてのお客様の要求を満たすのは現実的ではなく、ちょっとした会話1つをとっても人間によるサポートなしに行うのは危険ですらあります。これは冒頭で挙げた「Tay」の事例からも明らかで、やはり細やかで丁寧な受け答えはまだまだ人間にかないません。

さらに、例えばオンライン不動産仲介店舗を運営するiettyの場合は「ベランダの隣の部屋との仕切りの形状は?」「ペット可と書いてあるが、大型爬虫類の飼育は可能?」といったお問い合わせが寄せられます。これらは引っ越しの際に気になる情報ですが、事前にデータとして整備されている可能性はほとんどなく、結局のところオーナーへの問い合わせによってしか解決しない問題です。

人工知能といえども神を作ろうとしているわけではありません。「あらかじめ答えを持っていない、存在しない」お問い合わせには、今後いくら質が向上しても人間による確認が必要となるでしょう。こうした状況を考えると、チャットシステム内のボットも、それぞれ特定の役割を持つボット(特化型AI)が1つのチャットインターフェイスに複数常駐し、ユーザからの問いかけに応じて担当のボットが応答する、さらにどのボットも応答できないようなら人間が対応する、という形が技術的にもユーザ体験的にもふさわしい未来像となってくるかと思います。

この枠組みの場合、ユーザからの問いかけにどのボットが応答すべきか、また今誰が対応中で、どのようなステータスになっているかを管理するボットも必要になります。iettyでは、こうした1つのチャットスペース(ルーム)に複数のチャットと人間が共存するスキームを「ボット・オーケストレーション」と呼んでいますが、こうしたあり方が今後一般的になっていくでしょう。

米国WIRED誌の編集長Kevin Kelly氏は、人工知能(AI)のベストな姿として「AIだけでなくAIと人間の知性が補完し合って協働する『ケンタウルス』のようなモデルがふさわしい」と述べています。ケンタウルスはギリシャ神話の下半身が馬、上半身が人間の種族ですが、馬の部分を人工知能、体の部分を人間になぞらえたものでしょう。AIと人間がともにプレーするチェスリーグにもこの名前が使われているそうですが、こうした人間の良いところ、機械の良いところを組み合わせてユーザ体験を向上させる試みが今、求められているのではないでしょうか。

ケンタウルス・モデル

おわりに

iettyでは、これまで紹介してきたような未来像に基づき、チャットボットと人間(チャットオペレータ)が協働してお客様に接客を行う「オンライン接客プラットフォーム」を企画開発しています。現在は不動産領域に特化した商品提案、販売(契約)の仕組みとして稼働していますが、今後は対話を必要とするコマース全般に使える設計への拡張を視野に入れ、様々なシチュエーションや商品ジャンルに適用できるシステムを目指しています。

インターネットはこれまでメールとWebを基盤として、様々なビジネス利用が促進されてきました。しかし従来の技術では踏み込み切れなかった領域が存在し、ここを今「チャット」と「人工知能」という、古くて新しい2つの技術が猛烈な勢いで塗り替えようとしています。この世界的な潮流に対してどのような課題があり、私達が今回のタイトルである「現場」の一員としてどのように考え、取り組んでいるかのご理解の一助になれば幸いです。

株式会社iettty 執行役員CTO。 東京学芸大学大学院教育学研究科修了。日経リサーチ、Yahoo Japan、Groupon Japan BIマネージャー、マーケティングアプリケーションズ CTOを経て2016年より現職。システムエンジニアリングとデータサイエンスの融合をテーマに、現在はベンチャー企業での人工知能のビジネス利用に取り組む。

連載記事一覧

Think IT会員サービスのご案内

Think ITでは、より付加価値の高いコンテンツを会員サービスとして提供しています。会員登録を済ませてThink ITのWebサイトにログインすることでさまざまな限定特典を入手できるようになります。

Think IT会員サービスのご案内

関連記事