連載 [第4回] :
  GitHub Universe 2017レポート

GitHub.comが産み出すデータの活用法とは? 責任者たちが未来のソフトウェア開発を語る

2017年11月8日(水)
松下 康之 - Yasuyuki Matsushita
GitHub Universe 2017のキーノートを担当したメンバーに、GitHubの新技術がもたらす未来について訊いた。

ソースコードリポジトリーサービスGitHubの年次イベント、GitHub Universe 2017で発表された新たなデータサービス。今回は、同サービスを開発しているデータエンジニアリングチームの責任者であるMiju Han氏のインタビュー、そしてGitHubのSVP of TechnologyであるJason Warner氏のインタビューをお送りする。

Jason Warner氏(左)とMiju Han氏(右)

Jason Warner氏(左)とMiju Han氏(右)

ソフトウェア開発のプロセスに変革を

最初は、アナリティクス&データサイエンスグループのエンジニアリングマネージャーであるMiju Han氏だ。

自己紹介をお願いします。

Han:私は、GitHubのデータサイエンスチームのエンジニアリングマネージャーをしています。過去の経歴はどれも「データ」に関わるエンジニアリングですね。Google、TuneIn、Appleなどで仕事をして、約10ヶ月まえにGitHubに参加しました。

データサイエンティストという仕事をするのにGitHubを選んだのはなぜですか? データサイエンティストの仕事からは遠いように思えますが。

Han:データを活用して新しい価値を生むと言う意味では、ソフトウェア開発のプロセスはこれまであまり変化がなかったと思います。しかしGitHubには大量のソースコード、そしてプロジェクト、さらにそれを使うプログラマーがいるわけです。毎日何千回もコミットやプルリクエストが実行される、そのトラフィックデータを分析することで大きな価値を生むことができると考えたのです。このように考えて、あえてGitHubでデータサイエンティストの仕事をやってみようと思ったわけです。

チームの中には、様々な経歴を持ったエンジニアがいます。私自身は経済学を学んでいましたし、遺伝子工学やコミュニケーションを学んだエンジニアもいます。ソフトウェアを開発する際に必ず必要となるコミュニケーションについて、深く理解しているエンジニアがいることは重要だと思いますね。

キーノートの中で「プロジェクトの中で悪い行いをするユーザーをブロックする機能」が紹介されました。ソースコードを管理対象としていたGitHubが、ユーザーも管理の対象とする方向性に向かっているということでしょうか?

Han:GitHubの中では、ソースコードもユーザーもデータの観点からすれば同じなのです。しかしプロジェクトにおいてCode of Conductが用意されていない場合や、プロジェクトのルールについてちゃんとしたドキュメントを作っていないような場合は、往々にして少数のユーザーの行いが問題を生じさせることが分かっています。そこでそのプロジェクトにおいて誰かをブロックできるというのは、問題を抑止するためには効果的なのです。それをシステムに組み込んだということになります。

例えば、ひとつのプロジェクトでブロックされたユーザーが他のプロジェクトにやってきたことがわかると言う機能は、プロジェクトを上手に運営していくためには非常に強力な効果を発揮すると思います。オープンソースソフトウェアのプロジェクトと言ってもどれも同じではなく様々なものがあるので、運用はその管理者に任せることになりますが、それでもブロックする機能は求められていたものだと思っています。

レコメンドはしても広告は出さない

続いてここからは、Jason Warner氏のインタビューを紹介する。

元Heroku出身ということで同じオープンソースソフトウェアですが、GitHubを選んだ理由は?

Warner:Herokuはソフトウェアを実行するためのプラットフォームですが、GitHubはソフトウェアを書くためのプラットフォームです。私はソフトウェアを書く、コーディングするという部分にもっと革新を起こしたかったのです。その意味で、GitHub以上によいポジションにいる企業はないと思います。

ユーザーをブロックする機能や、新プロジェクトの情報をプッシュする機能は、ECサイトなどで行っているレコメンデーションの機能と本質的には同じ発想だと思います。であれば、GitHubのユーザーに対して「このツールが使いやすいよ!」のような広告を出すことも可能だと思います。GitHubとしてユーザーに広告を出す考えはありますか?

Warner:それは全くありません。GitHubは、ユーザーに価値を与えることをミッションとしています。そしてソフトウェアを書くことのサポートはその価値に相当すると思いますが、広告を出すことは価値を与えることにはならないと考えているからです。

しかしユーザーが新しい技術、たとえばビッグデータや機械学習などを学ぼうとした時に、GitHubであれば「このプロジェクトを見てみたら?」とレコメンドすることができます。これは、GitHubから出てくる様々なデータを繋ぐことで可能になるわけです。新しいプロジェクトに人が集まっているとか、アクセスが増えていると言うことにはちゃんと意味があるわけですね。この情報の共有は重要だと思います。

マーケットプレイスの中にいるパートナーにとっては、それらのデータは非常に価値があると思いますが、それがそのまま広告になることはないと思います。マーケットプレイスには無料のトライアル期間が設定されているのは意味があって、広告で売り込むのではなく、それを自分で使ってもらって評価するということを促したいからです。「広告を出すことはない」と断言できます。

はっきりとした回答ですね。それが聞きたいと思っていました。

Warner:そしてそれらのデータもAPIを公開して、エコシステムの中で利用できるようにします。これがオープンエコシステムのあるべき姿だと思います。

SVPとして、これから5年後にGitHubがどうなっていて欲しいですか?

Warner:個人的には3つの夢があります。1つ目は「GitHubのエコシステムがもっと拡大して欲しい」ということです。今回、マーケットプレイスにソフトウェアを紹介している企業を紹介しましたが、彼らはマーケットプレイスに公開したことで資金を調達できたのです。彼らがIPOまで行けるように、エコシステムが拡がることが最初の夢ですね。

2つ目は「GitHubのデータを使って、我々が知らない使い方をするパートナーが出てくる」ことです。これは「オープンイノベーション」と呼ぶべきものかもしれません。

そして3つ目は「ソフトウェアデベロッパーの持つ痛み、苦痛をもっと和らげる」ことですね。具体的には、DevOpsがGitHubを使うことでスムーズになるべきだと考えています。つまりCI/CDがGitHubを中心に自動化され、企業による活用がさらに推進されることを望んでいます。

GitHubに参加した理由として、Warner氏もHan氏も「本質的にそれほど変化のなかったソフトウェア開発を革新したい」という思いは共通しているようだ。6500万にも達する膨大なプロジェクト、ユーザーが提供するビッグデータ、そしてそれを機械学習させることで得られるインサイトは、これからのソフトウェア開発のあり方を大きく変えるかもしれない。そんな予感のするインタビューだった。

著者
松下 康之 - Yasuyuki Matsushita
フリーランスライター&マーケティングスペシャリスト。DEC、マイクロソフト、アドビ、レノボなどでのマーケティング、ビジネス誌の編集委員などを経てICT関連のトピックを追うライターに。オープンソースとセキュリティが最近の興味の中心。

連載バックナンバー

開発ツールイベント
第7回

【写真で見る】GitHub Universeが示す新しいイベントのスタイル

2017/11/16
GitHub Universe 2017レポートの最後は、IT系企業が開催するイベントの新しいスタイルという見地から会場のようすを紹介する。
開発ツールイベント
第6回

GitHub UniverseでMSのエンジニアが語った「共有と協力」への険しい道

2017/11/14
かつてはLinuxやGPLを敵視していたMicrosoftが、最大のOSS貢献者となるまでの変化を内部のメンバーが語った。
開発ツールインタビュー
第5回

GitHubにとってAPIとは? GraphQLが提供する価値とは?

2017/11/9
GitHub Universe 2017で発表されたGraphQL APIについて、Director of Ecosystem Engineeringに話を訊いてみた。

Think ITメルマガ会員登録受付中

Think ITでは、技術情報が詰まったメールマガジン「Think IT Weekly」の配信サービスを提供しています。メルマガ会員登録を済ませれば、メルマガだけでなく、さまざまな限定特典を入手できるようになります。

Think ITメルマガ会員のサービス内容を見る

他にもこの記事が読まれています