ディープラーニング最前線2016レポート ~基調講演~
昨今、ITの領域で最もホットなキーワードの1つが「ディープラーニング」だ。2016年の2月9日、オープンソースビジネス推進協議会(OBCI)主催のセミナー「ディープラーニング最前線2016?OSS視点で読み解くビジネス活用の現状と課題」が開催された。150名の定員で参加者を募ったところ、短期間で満席に達したところからも、ディープラーニングに対するIT業界の関心の高さが伺えると言える。好評のうちに終了したセミナーの概要をご紹介しよう。
基調講演
まず基調講演に登壇されたのは、東京大学大学院の松尾豊准教授。ディープラーニング関連のトピックをチェックしている方なら、松尾氏の名前を必ず目にしているはずと断言できる、この分野の第一人者である。「人工知能は人間を超えるか -OSS視点で読み解くディープラーニングのビジネス活用-」と題して、講演していただいた。
人工知能の研究は、すでに半世紀以上の歴史を持っている。これまでの研究では、研究者が現実世界の対象物を観察し、注目すべき点を見出し(特徴量の選択)、モデルの構築を行っていた。モデル構築後の処理は自動化されていたが、モデル化そのものには人間が介在する必要があったのだ。このことが、人工知能研究における唯一かつ最大の問題点であった。これに対し、現在の「機械学習」「ディープラーニング」をキーワードにした研究の盛り上がりは、この壁を突破しつつある。ディープラーニングでは、データをもとに注目すべき特徴量が自動的に選択されるのだ。
人間の目を超える画像認識
ディープラーニングの応用例の分かりやすい例として挙げられるのが、多くの企業や大学で研究されている画像認識だろう。2012年、国際的な画像認識の大会であるILSVRC(ImageNet Large Scale Visual Recognition Challenge)において、ディープラーニングを用いたチームが、エラー率15%台という結果を出したことで注目を集めた。従来の人間が特徴量を設計した方式では、エラー率は26%台であり、ディープラーニングの成果は文字通り桁違いだったわけだ。
その後も研究は続けられており、精度は向上し続けている。最新の結果では、エラー率は3.5%にまで低下しているという。この画像認識のテストを人間が行うと、エラー率は約5%となる。つまり、最新の研究成果を用いた人工知能は、画像認識に関しては人間以上の精度を実現していると言える。
ディープラーニング+強化学習
ディープラーニングの研究の先にあるのが強化学習、すなわち「行動を学習する仕組み」である。人間の行動を例に考えてみよう。サッカーボールを上手にキックできるようになるためには、練習が必要だ。上手に蹴ることができたら、その時の身のこなし方を繰り返すことで、段々と上達していく。この「上手に蹴れた」ことは「報酬」であり、報酬がもらえたら事前の行動を強化する。これが学習である。これは人工知能研究では新しい概念ではなく、以前からある技術だ。報酬の有無を決めるためには、どのような状態が望ましいのかを決める必要があるが、これまではその状態を人間が定義していた。
そこに強化学習とディープラーニングを組み合わせることで、ディープラーニングから生成された特徴量を用いて状態を表すという仕組みが登場した。この実例として挙げられたのが、Googleが買収したDeepMind社の「テレビゲームをプレイするAI」の研究だ。同社は画像の特徴量を用いて状態を定義し、ゲームのスコアを報酬としてゲームをプレイするAIを実現した。このAIは、最初のうちはヘタでも段々と上達していき、ブロック崩しであれば、端を崩してブロック群の裏側にボールを送る方法を「学ぶ」ことができるという。
このディープラーニングと強化学習の組み合わせを実社会で応用する試みも始まっており、2016年のCESにおいて日本のPreferred Networks社とトヨタが、徐々に運転を習熟していくミニカーのデモ走行が行われた。紹介された動画を見ると、最初のうちは車はまったく動かず、そのうち少し進んでは障害物や他の車にぶつかるようになる。さらに時間が経つと、互いにぶつかり合うこともなく複数のミニカーがスムースに走れるようになる。この自動運転ミニカーが走っている環境に、人間が操縦するミニカーを追加して、少々乱暴な運転をしてみても、学習済みのミニカーは避けてくれるそうだ。
これらの実例が示す「運動の習熟」は人間だけでなく、犬や猫といった動物でもできることだが、それではなぜ人工知能ではできなかったのだろうか? このことは人工知能の研究者の間では、ずっと以前から知られていたことで、「子供のできることほど難しい」(人工知能がやるのは難しい)というフレーズで言い表されていた。これは提唱者の名前をとって「モラベックのパラドックス」と呼ばれている。
松尾氏によれば、モラベックのパラドックスは、人工知能の研究においては特徴量の抽出こそが最も計算量が大きい高負荷なステップであったことを示しているという。そしてそれが昨今のハードウェア(GPU)の高性能化により、ようやく可能になってきたということだそうだ。
ディープラーニングで加速する技術的発展
このように、ディープラーニングによって人工知能は「認識」することが可能になった。そして今後も発展を続けることにより、「運動」「言語」といった能力を備えるようになると松尾氏は指摘する。
2014年9月の時点では、「言語」能力を備え大規模な知識理解ができるようになるのは、2030年ごろと予測されていた。しかしボトルネックであった「認識」が実現したことにより、予想を上回る速度で技術が進歩しており、2025年ごろに実現すると予想していたことが2015年末までには一部実現してしまったという。
その一例が「文章からイメージの生成」と「イメージからの文章作成」である。つまり言語を理解し、それにマッチした画像と結びつけることができるようになったというわけだ。
この進歩の勢いを考慮すると未来予測は大きく変化し、2030年には「意識・自己・再帰」といった領域まで可能になるのではないかという予測が示された。
既存産業への影響は?
ディープラーニングや機械学習は、産業や社会にどのような影響をもたらすだろうか? 松尾氏は本質的な変化のポイントは(1)画像・映像認識、(2)運動の習熟の2点と指摘する。現状では、画像認識ができないために人間がやっている仕事がたくさんあるが、これが自動化され監視のコストが100分の1以下になる。また機械も「運動の習熟」ができることにより、農業、建設、食品加工といったこれまで自動化が困難だった分野も自動化される。最終的には、日常生活や産業界においてロボットを活用するといったかたちとなるだろう。
そしてここに至る道には、「情報路線」と「運動路線」の2つの道があると松尾氏は指摘する。このうち情報路線は、GoogleやFacebookなど「GAFMA(Google、Amazon、Facebook、Microsoft、Apple」が非常に強く、今から対抗するのは困難だが、日本の企業にとっては「ものを動かす」「操作する」といった運動路線にがチャンスがあるのではないかとのことだ。
IT関係者はディープラーニングとどう向かい合うべきか?
そして最後に、セミナー参加者のほとんどが該当するであろうIT関連従事者とディープラーニングとの関連についての説明があった。
ディープラーニングのフレームワークとしては、Caffe、Tensorflow、そして日本発のChainerなどがあるが、特に優劣はなく、自身にとって使いやすいものを選んでいけば良いそうだ。また昨今では、最新の研究成果もソースコードがGitHubに公開されるようになっており、それ自身が競争力ではなくなっていると松尾氏は指摘し、今後はデータとハードウェアが大切になってくると予測する。
これはどういうことか? 松尾氏によれば、ディープラーニングによりロボットがあたかも(動物で言うところの)小脳を持つようになるが、その変化に合わせてハードウェアとアルゴリズムが歩調を合わせて進化していくことになるという。
その一方で、IT企業の業務そのものには、ディープラーニングを直接応用できる部分はないとも指摘する。盛んに喧伝されるビッグデータなどについても、人間が特徴量を指定したほうがよほど速く効率的だ。
ディープラーニングを活かすチャンスは、むしろ製造業や非IT企業の領域にあり、そういう分野の企業との協業も良いだろう。「今すでにあるデータをどう使うか」ではなく、まだ行われていない「おもしろいタスクを見つける」ことが重要と松尾氏は指摘する。
現在の日本は少子高齢化が進み、運動を伴う労働力のニーズが高まっている。ディープラーニングにより認識が行え、行動の習熟ができるロボットは、この課題の解決策になりうる。そしてその技術を輸出することで、産業競争力も高められるだろう。これはいわば人工知能による日本の「ものづくり」の復権であり、それを実現するために人材の育成など、正しく早く動くことが大切だと松尾氏は主張する。そしてディープラーニングによる新しいカタチの未来像を描いていくことを説き、講演を終えられた。
内容的にも非常に盛りだくさんで、1時間があっという間に感じられた講演だった。
連載バックナンバー
Think ITメルマガ会員登録受付中
全文検索エンジンによるおすすめ記事
- 話題のディープラーニングを総括する特別イベントを2月9日に開催
- なぜ社会現象にまでなったのか!ポケモンGOに学ぶARアプリの最適なUXとは
- NICTらの研究チームが仮想化Wi-Fiを含めた複数の仮想広域網の国際実証実験に成功
- AI最前線の現場から【エクサインテリジェンス】心臓MRI検査の診断支援、「医療×AI」への取り組み
- 第2回 ホロス2050未来会議「第2章 人工知能の現在 /COGNIFYING」レポート
- そもそもディープラーニングとは何か?
- PS4の上位機種「PS4 Pro」を発表、多分野でのVR活用も進む
- 7年ぶりの新型レゴ マインドストームEV3を手にとって体験しよう
- 国内のOSS利用実態調査結果を発表、「Hadoop/Spark Con」基調講演―Sparkの将来像とは、ほか
- アイディア溢れる子どもクリエイターが集結! 熱戦を繰り広げたロボットコンテスト「VIVITA ROBOCON 2019 FINAL」レポート