「AIの民主化」を掲げるDataRobot、日本での活動を本格化
2012年にボストンで起業されたAIベンチャーのDataRobotが、日本における本格的な活動を開始した。DataRobotはAIの中でも近年非常に市場が盛り上がっている機械学習を、シンプルなグラフィカルユーザーインターフェースで素早く構築できる自動化ソリューションを提供している。今回、新たにカントリーマネージャーの発表と東京オフィスの開設を行い、すでにパートナーとなっている新日鉄住金ソリューションズとともに、営業活動を本格化させるという。
今回は、DataRobotのカントリーマネージャーである原沢滋氏、データサイエンティストであるシバタアキラ氏にインタビューを行い、DataRobotのソリューションやこれからのビジネスについて聞いた。
まずDataRobotについて教えてください。
シバタ氏:もともとデータサイエンティストが集まってできた会社で、データサイエンティストの「天下一武道会」でもあるKaggleのコンペティションで上位に入っているようなデータサイエンティストが、2012年に創業した会社です。最初は2人で始めて、今は150名くらいになりました。本社がボストンにあり、開発の拠点はウクライナのキエフに、また海外の拠点として東京、シンガポール、ロンドン、パリなどがあります。機械学習を使って分析をやるんですが、単に分析するだけではなくて未来を予測するということができるようになります。例えば保険や携帯電話の解約を予測する、というようなことができるようになります。2015年にリクルートさんが資本を入れてくれたんですが、リクルートさんはユーザーとしても仕事と人のマッチングなどに使っていただいています。
原沢氏:私達は「AIの民主化」と言っているんですが、これまで専門家を雇わないとできなかったような、分析や予測などのデータサイエンティストの仕事を誰でもができるようにする。そのための自動化を実現するソフトウェアを提供するのがミッションです。
マネタイズはどのように?
シバタ氏:基本的には2つの使い方があります。SaaSとして使っていただく方法と、オンプレミスのソフトウェアを年間ライセンス利用料の形で使っていただく方法です。どちらも機械学習のためのプロセス、これはDataRobotでは「Worker」と呼んでいますが、その数によって価格が変わります。あとユーザーIDの数、つまり利用する人の数でも価格は変わりますね。Workerを増やせば、複数のモデルを並列に実行できることになります。実際にはオンプレミスで利用していただいている例が多いです。SaaSの場合は新しいモデルができたら常にUpdateしていきますので、最新のモデルを利用することができます。オンプレミスの場合は数ヶ月に1回ぐらいの頻度で更新を行う形になります。
通常はデータサイエンティストがデータと目的によってモデルを選択してプログラミングを行って実行するという部分を、GUIを使って簡単にするということでしょうか?
シバタ氏:その部分が目立ちますけど、実際には機械学習のモデルを自動化してくれるということが重要ですね。機械学習のモデルだけではなくて予測のためのデータを準備する部分も組み込まれていますので、例えば欠損値をどうするのか? という辺りにも我々のデータサイエンティストのノウハウが組み込まれています。そのデータに最適なモデルを自動的にリストアップすることで、素早く試すことができます。それに単に試行するだけではなくて、ある程度モデルが固まったところで運用に組み込むために実行用のスクリプトを作ります。それをREST APIで呼ぶことで、実際のデータ分析、予測をシステム化することができます。実際には、その部分にものすごく開発工数がかかりますので、そこを評価していただいています。それこそ数ヶ月かかっていたことが、数時間でできるようになるのです。それにプログラマーやデータサイエンティストだけではなく、今はExcelで分析をやっているような人にも使ってもらえるようになるのが大きいと思います。
モデルは今どのくらいあるんですか?
シバタ氏:全体で1000ぐらいはあります。アルゴリズムには向き不向きがありますので、そのデータに向いたアルゴリズム、テンプレートを表示します。その辺りに、データサイエンティストのノウハウが効いてます。
Googleが深層学習の説明に使うような大量の画像から猫を見分ける、みたいなことはできるんですか?
シバタ氏:今のバージョンは入力として数値データを想定していますので、画像を直接読み込ませることはできません。画像を数値化して、そのデータを入力として使うやり方になりますね。実際に社内のエンジニアが試してみたところ、高い精度で画像認識を行えたと言っています。将来的な開発計画としては、「時系列データをなるべく手間をかけずに処理する」と言う部分と、教師なし機械学習をやりたいと考えています。他には、Hadoopのようにデータの処理をマッシブに並列処理化するというのも今後の製品計画の中に入っています。
予測した結果をビジネスに反映するために、例えば経営層向けのダッシュボード的にデータを可視化する、というようなことはできるんですか?
原沢氏:今使っている機能は全部APIでコールできますので、例えばTableauからそのAPIをコールしてもらえばデータを取ってダッシュボードなどにビジュアライズすることができます。
日本でのビジネス計画は?
原沢氏:売り上げに関しては公表することはできませんが、日本のオフィスの増強は検討しており、現在の5名体制を10名以上にしようというのが2017年の計画です。他にもパートナーも増やしていきたいと思っています。プログラミング言語のように、ユーザーが勝手になんでもできるというソフトウェアではないので、PoC(実証実験)をパートナーと一緒に進めながら拡めていけたらと思っています。日本はDataRobotにとっても重要な市場なので、これからご期待ください。
GoogleやMicrosoft Azureなど大手が進出している機械学習の分野に、Kaggleでもトップと言われるようなデータサイエンティストの知見を形にして「機械学習の民主化」を目指すベンチャーのDataRobotであるが、すでに国内ではリクルートホールディングス、大阪ガス、パナソニックなどの大手のユーザーを獲得している。ベンチャーには鬼門のローカライゼーションも、GUIのインターフェースなどはシバタ氏の尽力でかなりこなれた日本語になっている。これからの成長が期待できそうだ。
連載バックナンバー
Think ITメルマガ会員登録受付中
全文検索エンジンによるおすすめ記事
- デル、最先端シンクライアント「Wyse 3040」を発表
- 仮想LAN(Virtual LAN)の基本[ドメイン/サブネット/トランキング]
- バッファロー、「Wi-Fi 6(IEEE 802.11ax)」に対応するWi-Fiアダプターを発表
- バッファロー、「Wi-Fi 6(IEEE 802.11ax)」に対応するWi-Fiアダプターを発表
- 「Raspberry Pi 4」が日本国内で発売開始
- ミントウェーブ、テレワーク向け13.3型/15.6型モバイルシンクライアント端末を発表
- デスクトップ仮想化(VDI)とシンクライアントはどう違う?
- アライドテレシス、インターネット回線やVPN装置などテレワークに必要な機器やサービスをまとめた「アライド光テレワークパック」の提供を開始
- ECS、クアッドコアの「Apollo Lake」を搭載した小型ベアボーン「LIVA Z」を発表
- VLANトランクの設定を理解する[VLANとVLANトランクの分析]