日本人エンジニアが起業した米トレジャーデータのクラウド型ビッグデータ基盤技術とは

2013年5月23日(木)
Think IT編集部

5月20日、米国トレジャーデータ社の日本国内における事業展開について、新丸の内ビルディングにて発表会が行われた。トレジャーデータのクラウド型ビッグデータ技術と国内展開について紹介する。

トレジャーデータ創業から国内法人設立まで

トレジャーデータは米国に拠点を置くが、日本のエンジニア3名が創業した企業である。はじめに、同社のCEOを務める芳川裕誠氏より、日本法人立ち上げの概要と米国のビッグデータ事情が紹介された。

トレジャーデータのCEO、芳川裕誠氏

インターネット黎明期から存在する時系列でかつ非構造化されたデータを、IT分野に限らず、あらゆるビジネスにおいて活用するための基盤がようやく整ってきたが、近年、ビッグデータという単語が使われることで広く知られるようになり、この増大するデータをどうやって運用、解析するかに大きな関心が持たれている。

このビッグデータ処理技術をクラウド上で展開するべく、2011年12月にCTOの太田氏、ソフトウェアアーキテクトを務める古橋氏の3名でトレジャーデータを創業。開発期間を経て、全世界に向けて2012年9月に商用サービスを開始した。太田氏は日本におけるHadoopの第一人者として、古橋氏は分散ストレージシステムの「kumofs」の設計などで知られている。

これまで芳川氏が感じていたのは、ビッグデータ解析のシステム構築の問題だった。社内のデータ管理、解析には様々な要素技術を組み合わせてシステムを作っていくが、構築は手間と時間がかかってしまう。その部分をクラウドサービスとして提供し、ユーザー企業の負荷を下げて本質的なデータ解析そのものに集中できるようにしていくのが、トレジャーデータの事業だと語った。

試験運用の時期を含め、サービス開始以来、2012年4月現在で導入企業は70社以上となり、ジャンルは製造業、IT企業など幅広い業種に及ぶ。料理のレシピ検索サービスであるクックパッドや、広告代理店の博報堂、マネックス証券、salesforceなど、いずれも規模の大きなサービス・企業名が挙げられた。他にも大規模な製造業、流通業などにサービスを提供中で、全世界で4000億件以上のデータを解析・提供している。

日本での法人設立について、芳川氏は日本のソフトウェアエンジニアが世界で十分に通用する確信があることを強調。ほかにも試験運用時から日本国内に多くの顧客がいたことを挙げた。米国と一体でサービスを開発する拠点として、また現在約30社の顧客を持つ日本企業へのさらなる普及を目指す拠点として日本を選んだと述べた。

投資家には、Yahoo!創業者の一人であるジェリー・ヤン氏をはじめ、シスコ・システムズの上級副社長であるダン・シャインマン氏など数多くが名を連ねる。日本人としては、Ruby開発者でおなじみのまつもとゆきひろ氏の名前も見ることができた。

トレジャーデータプラットフォームと活用事例

芳川氏の説明に続き、ジェネラルマネージャーの堀内氏からは、トレジャーデータのサービスを支えるプラットフォームと活用事例についての解説がされた。

トレジャーデータのジェネラルマネージャーを務める堀内健后氏

トレジャーデータのプラットフォームは大きく分けて「インポート」「ストア」「可視化」の3つで構成されている。

インポートでは、ユーザーのデータ取り込むため、td-agentとBulk Importerという2つの機能を用意している。td-agentではサーバーから随時データをインポートする機能で、Bulk Importerは既にあるCSVや構造化された大きなデータをインポートする機能。インポートしたデータをストアするための機能は自社開発の列指向型データベース「Plazma」にHadoopの分散処理機能を融合。高速にかつ設定せずにデータを蓄積することができる。ストアしたデータは可視化する必要があるため、Hive、JDBCという機能が使う。これらの機能によって、一般的なデータベース言語であるSQLなどを使ってデータを抽出することができる。

これら3つの機能をクラウド上で展開、ストアだけでなくデータの収集機能を提供することで、自社開発のデータベース内で分散処理を行い、ユーザーが分析するためのデータ提供を行う。
クラウド上にサービスを展開しているため、アカウントを用意するだけですぐに利用できることに加え、月額課金制のため、初期コストを低く抑えることができる。またデータ収集も機能が用意されているため比較的に簡単に行えることや、高速処理を損なわないためのサーバー処理機能の拡張も可能になっているなど、ユーザーが快適に利用するための機能をあらかじめ備えたサービスだといえる。

トレジャーデータプラットフォーム(クリックで拡大)

このソリューションが持つメリットの一例として、1日あたり数時間かかっていたバッチ処理を速ければ数分で完了できることが挙げられる。そのため、1日に1回程度しか行えなかったレポートを複数回更新できるようになり、より短縮化が求められる現代の経営サイクルに対応できるようになっている。

クックパッドの事例紹介

最後に、クックパッドにおける導入事例が紹介された。

クックパッドはWeb上で料理のレシピを紹介するサービス。ユーザーに対するレコメンドレシピを紹介するため、年間を通して検索結果を蓄積している。旬の食材に合わせた集計を行っているが、直近のものだけではなく、前年の同じ時期にどんなランキングだったか、というデータを持っておく必要がある。

クックパッドには既に優秀なエンジニアもいたし集計ツールはあったが、検索結果を蓄積するデータベースは肥大化を続け、日々の運用やデータベース拡張のための工数が次第に増大していったという。そのため、本来必要なはずの経営層のためのデータ分析を行うための基盤利用に時間かかかってしまい、1日1回のレポーティングがやっとという状態だった。

これらのサーバー群をトレジャーデータプラットフォームに置き換えることで、運用するエンジニアの負担が軽減され、コスト削減に成功した。エンジニアは本来のサービス開発に集中でき、経営層のためのレポーティングを随時行えるようになったという。この入れ替えにかかった期間はおよそ3週間で、こういったスピード感にもクラウド型のサービスを利用する大きなメリットを感じることができる。

想定ターゲット、料金など

発表後の質疑応答では、多くの質問が寄せられた。

サービスの対象ターゲットについての質問では、販促、レコメンデーション以外にも製造業や流通・小売り業、広告業界などが挙げられた。例えばセンサーデータ、取引データ等を扱うユーザーもターゲットになりうる。現時点では発表できる事例は少ないが、分析結果についてもプロモーションなどに限らず、ピーク数管理や故障検知などトレンドを追うケースも考えられるとのこと。

料金は月額3000ドルから。それに加え、蓄積するデータ量や集計のスピード等によって見積もりが必要となる。料金にはストレージ容量、コンピューティングリソースが含まれ、td-agentがサポートされる。また活用・導入にあたっての設計のサポートも、メニューにはないものの可能な限り支援される。

なぜアメリカで創業し、そして日本で事業展開しようと思ったのかという最後の質問では、まずグローバルでの情報発信のためアメリカでプロダクトカンパニーを作る必要を感じたこと、そして実際にアメリカに住んでみて、身の回りには多くの日本製品が存在し、あらためて世界に占める日本産業の大きさを感じたという。その日本の産業界で、自分たちの持つビッグデータ技術を活用することに大きな興味を持っていると話していた芳川氏の姿が印象的だった。

発表会の後も、芳川氏と堀内氏にはひっきりなしに質問が寄せられていた。日本での本格的な展開を迎えるトレジャーデータの今後に期待したい。

【関連リンク】

トレジャーデータ

(リンク先最終アクセス:2013.05)

<編集部より> 記事タイトルおよび一部人名に誤りがあったため修正しました。(2013.05.23)

“オープンソース技術の実践活用メディア” をスローガンに、インプレスグループが運営するエンジニアのための技術解説サイト。開発の現場で役立つノウハウ記事を毎日公開しています。

2004年の開設当初からOSS(オープンソースソフトウェア)に着目、近年は特にクラウドを取り巻く技術動向に注力し、ビジネスシーンでOSSを有効活用するための情報発信を続けています。クラウドネイティブ技術に特化したビジネスセミナー「CloudNative Days」や、Think ITと読者、著者の3者をつなぐコミュニティづくりのための勉強会「Think IT+α勉強会」、Web連載記事の書籍化など、Webサイトにとどまらない統合的なメディア展開に挑戦しています。

また、エンジニアの独立・起業、移住など多様化する「働き方」「学び方」「生き方」や「ITで社会課題を解決する」等をテーマに、世の中のさまざまな取り組みにも注目し、解説記事や取材記事も積極的に公開しています。

連載バックナンバー

Think ITメルマガ会員登録受付中

Think ITでは、技術情報が詰まったメールマガジン「Think IT Weekly」の配信サービスを提供しています。メルマガ会員登録を済ませれば、メルマガだけでなく、さまざまな限定特典を入手できるようになります。

Think ITメルマガ会員のサービス内容を見る

他にもこの記事が読まれています