連載 :
  ReadWrite Japan

Airbnbがデータと機械学習コードを公開

2015年6月29日(月)
ReadWrite Japan

今月4日、Airbnbは社内技術のイノベーションにつながる扉を勢いよく開け放った。同社は、オープンソース化した機械学習パッケージ・ソフトだけでなく、自社のデータ・インフラを一部公開し、“ホスト”としてコードを迎え入れる存在になろうとしている。

AirflowとAerosolveはすでに公開中のAirpalに続くことになった。Airbnbは今年すでにAirpalをオープンソース化している。Airbnbはまた、同社の全オープンソース・プロジェクトを管理するairbnb.ioを発表し、Githubページを補完するとしている。

4日の午前、開発者を中心とする同社の会議、OpenAirがサンフランシスコで行われた際に、Airbnbの技術担当副社長であるマイク・カーティスがこのように発表した。

Airbnbは、ソフトウェアを販売するのではなく、ホストの家やアパートなど、今までにはなかった滞在先と利用者をつなぐことで利益を得ている。同社が社内のソフトウェア・プロジェクトをオープンソースとして公開すれば、技術革新者という同社のイメージ強化につながる。OpenAirでは、同社の「技術ブランド」が盛んに言及された。社外の人間に自社のコードをチェックしてもらったり、使ってもらったりすることで、理屈としては、コードの成果を公開することによって、今いる技術者を自社に抱えておくことができるし、新たに技術者を採用する際の一助となるはずだ。

データ・パイプラインの除去

「データ・パイプライン」とは、ウェブサイト、モバイル・アプリ、その他のシステムが生成する大量のデータを取り込んだり転送したりするのに企業が利用するシステムのことだ。Airflowを利用すると、プログラムでデータ・パイプラインの作成、計画、管理ができる。

Airflowは同社が以前使用していたデータ・パイプラインのインフラに不満があったことから生まれたものだ。

「当時利用していたデータ・パイプラインは、実際に必要なものよりも少なくとも一世代以上は遅れていました」とカーティスは述べている。「われわれが作り上げたのはモンスターでした。データ・ウェアハウスは混とんとしていたのです」。

現在、Airbnbのデータ・パイプラインは全てAirflowを利用している。

サンフランシスコで開催されたOpenAir 2015にて、「データ・ウェアハウスは混とんとしていた」と語るAirbnb技術担当副社長のマイク・カーティス

サンフランシスコで開催されたOpenAir 2015にて、「データ・ウェアハウスは混とんとしていた」と語るAirbnb技術担当副社長のマイク・カーティス

機械自身に学習させよう

AerosolveではAirbnbによる最新の機械学習の成果が表れており、アルゴリズムを常時自動で改善するシステムを生み出している。同社が今月4日に発表した新製品、Price Tips はAerosolveによって動作している。

AirbnbはPrice Tipsを利用し、どうやって宿の料金設定をすればよいかを、年中無休でホストにアドバイスしている。Price Tipsを初めて試験的に運用した際には、ホストのつけた料金とアドバイスされた料金との差額が5%以内だった場合、宿が予約される傾向は4倍以上になったとカーティスは述べている。Aerosolveはそのような判断ができるように作られているのだ。

AirflowやAerosolveを利用したら、その感想をぜひ我々に聞かせてほしい。

Richard Procter
[原文]

※本記事はReadWrite Japanからの転載です。転載元はこちらをご覧ください。

※本ニュース記事はReadWrite Japanから提供を受けて配信しています。

連載バックナンバー

Think ITメルマガ会員登録受付中

Think ITでは、技術情報が詰まったメールマガジン「Think IT Weekly」の配信サービスを提供しています。メルマガ会員登録を済ませれば、メルマガだけでなく、さまざまな限定特典を入手できるようになります。

Think ITメルマガ会員のサービス内容を見る

他にもこの記事が読まれています