GitHub.comが産み出すデータの活用法とは? 責任者たちが未来のソフトウェア開発を語る
ソースコードリポジトリーサービスGitHubの年次イベント、GitHub Universe 2017で発表された新たなデータサービス。今回は、同サービスを開発しているデータエンジニアリングチームの責任者であるMiju Han氏のインタビュー、そしてGitHubのSVP of TechnologyであるJason Warner氏のインタビューをお送りする。
ソフトウェア開発のプロセスに変革を
最初は、アナリティクス&データサイエンスグループのエンジニアリングマネージャーであるMiju Han氏だ。
自己紹介をお願いします。
Han:私は、GitHubのデータサイエンスチームのエンジニアリングマネージャーをしています。過去の経歴はどれも「データ」に関わるエンジニアリングですね。Google、TuneIn、Appleなどで仕事をして、約10ヶ月まえにGitHubに参加しました。
データサイエンティストという仕事をするのにGitHubを選んだのはなぜですか? データサイエンティストの仕事からは遠いように思えますが。
Han:データを活用して新しい価値を生むと言う意味では、ソフトウェア開発のプロセスはこれまであまり変化がなかったと思います。しかしGitHubには大量のソースコード、そしてプロジェクト、さらにそれを使うプログラマーがいるわけです。毎日何千回もコミットやプルリクエストが実行される、そのトラフィックデータを分析することで大きな価値を生むことができると考えたのです。このように考えて、あえてGitHubでデータサイエンティストの仕事をやってみようと思ったわけです。
チームの中には、様々な経歴を持ったエンジニアがいます。私自身は経済学を学んでいましたし、遺伝子工学やコミュニケーションを学んだエンジニアもいます。ソフトウェアを開発する際に必ず必要となるコミュニケーションについて、深く理解しているエンジニアがいることは重要だと思いますね。
キーノートの中で「プロジェクトの中で悪い行いをするユーザーをブロックする機能」が紹介されました。ソースコードを管理対象としていたGitHubが、ユーザーも管理の対象とする方向性に向かっているということでしょうか?
Han:GitHubの中では、ソースコードもユーザーもデータの観点からすれば同じなのです。しかしプロジェクトにおいてCode of Conductが用意されていない場合や、プロジェクトのルールについてちゃんとしたドキュメントを作っていないような場合は、往々にして少数のユーザーの行いが問題を生じさせることが分かっています。そこでそのプロジェクトにおいて誰かをブロックできるというのは、問題を抑止するためには効果的なのです。それをシステムに組み込んだということになります。
例えば、ひとつのプロジェクトでブロックされたユーザーが他のプロジェクトにやってきたことがわかると言う機能は、プロジェクトを上手に運営していくためには非常に強力な効果を発揮すると思います。オープンソースソフトウェアのプロジェクトと言ってもどれも同じではなく様々なものがあるので、運用はその管理者に任せることになりますが、それでもブロックする機能は求められていたものだと思っています。
レコメンドはしても広告は出さない
続いてここからは、Jason Warner氏のインタビューを紹介する。
元Heroku出身ということで同じオープンソースソフトウェアですが、GitHubを選んだ理由は?
Warner:Herokuはソフトウェアを実行するためのプラットフォームですが、GitHubはソフトウェアを書くためのプラットフォームです。私はソフトウェアを書く、コーディングするという部分にもっと革新を起こしたかったのです。その意味で、GitHub以上によいポジションにいる企業はないと思います。
ユーザーをブロックする機能や、新プロジェクトの情報をプッシュする機能は、ECサイトなどで行っているレコメンデーションの機能と本質的には同じ発想だと思います。であれば、GitHubのユーザーに対して「このツールが使いやすいよ!」のような広告を出すことも可能だと思います。GitHubとしてユーザーに広告を出す考えはありますか?
Warner:それは全くありません。GitHubは、ユーザーに価値を与えることをミッションとしています。そしてソフトウェアを書くことのサポートはその価値に相当すると思いますが、広告を出すことは価値を与えることにはならないと考えているからです。
しかしユーザーが新しい技術、たとえばビッグデータや機械学習などを学ぼうとした時に、GitHubであれば「このプロジェクトを見てみたら?」とレコメンドすることができます。これは、GitHubから出てくる様々なデータを繋ぐことで可能になるわけです。新しいプロジェクトに人が集まっているとか、アクセスが増えていると言うことにはちゃんと意味があるわけですね。この情報の共有は重要だと思います。
マーケットプレイスの中にいるパートナーにとっては、それらのデータは非常に価値があると思いますが、それがそのまま広告になることはないと思います。マーケットプレイスには無料のトライアル期間が設定されているのは意味があって、広告で売り込むのではなく、それを自分で使ってもらって評価するということを促したいからです。「広告を出すことはない」と断言できます。
はっきりとした回答ですね。それが聞きたいと思っていました。
Warner:そしてそれらのデータもAPIを公開して、エコシステムの中で利用できるようにします。これがオープンエコシステムのあるべき姿だと思います。
SVPとして、これから5年後にGitHubがどうなっていて欲しいですか?
Warner:個人的には3つの夢があります。1つ目は「GitHubのエコシステムがもっと拡大して欲しい」ということです。今回、マーケットプレイスにソフトウェアを紹介している企業を紹介しましたが、彼らはマーケットプレイスに公開したことで資金を調達できたのです。彼らがIPOまで行けるように、エコシステムが拡がることが最初の夢ですね。
2つ目は「GitHubのデータを使って、我々が知らない使い方をするパートナーが出てくる」ことです。これは「オープンイノベーション」と呼ぶべきものかもしれません。
そして3つ目は「ソフトウェアデベロッパーの持つ痛み、苦痛をもっと和らげる」ことですね。具体的には、DevOpsがGitHubを使うことでスムーズになるべきだと考えています。つまりCI/CDがGitHubを中心に自動化され、企業による活用がさらに推進されることを望んでいます。
GitHubに参加した理由として、Warner氏もHan氏も「本質的にそれほど変化のなかったソフトウェア開発を革新したい」という思いは共通しているようだ。6500万にも達する膨大なプロジェクト、ユーザーが提供するビッグデータ、そしてそれを機械学習させることで得られるインサイトは、これからのソフトウェア開発のあり方を大きく変えるかもしれない。そんな予感のするインタビューだった。
連載バックナンバー
Think ITメルマガ会員登録受付中
全文検索エンジンによるおすすめ記事
- ソフトウェア開発支援の先にGitHubが目指すエコシステムが見えた?
- GitHubが年次カンファレンスで新サービスやAIの応用などを発表
- GitHub Universeで製品担当VPが語ったGitHub Actionsのインパクト
- GitHub Universe開催。ワークフローを実現するActionsなど多くの新機能を発表
- GitHub Universe 2019でプロダクトデザイナーに訊いた、易しさと高機能をバランスさせるチャレンジ
- GitHub Universe開催、ActionsとPackagesの背景にある思想をCTOに訊いた
- GitHub SatelliteでSVPに聞いたシステムインテグレーターへのアドバイスとは
- GitHub Satellite都内で開催。MSによる買収発表後もブレない姿勢を見せる
- GitHub Universe開催。βユーザーたちが語るActions導入の容易さ
- GitHub Universeで発表されたGitHub Desktopの最新バージョンとは?