GitHub Universe 2024開催。初日のキーノートはデモ満載でCopilotの拡がりを見せつける内容に
GitHubが開催する年次カンファレンスGitHub Universe 2024が、2024年10月にサンフランシスコで開催された。朝一番に行われた約50分のキーノートはCEOのThomas Dohmke氏から始まり、プロダクトマネージャー、リサーチャー、デベロッパーアドボケイトなどのスタッフが登壇し、GitHubの一大ブランドとなった生成型AIを使ったプログラミングアシスタントCopilotの進化と利用範囲の拡大を見せつける内容となった。
動画は以下のリンクから参照されたい。
●動画:GitHub Universe 2024 opening keynote: delivering phase two of AI code generation
冒頭でDohmke氏はGitHubを使うデベロッパーとオープンソースコミュニティの増加、プルリクエストの数などを紹介し、オープンソースコミュニティの支援者としてオープンソースがITの土台として勝者となったと語った。
オープンソースソフトウェアを開発するコミュニティにはGitHubを使う際のコンピュータ資源は無償で提供されており、CPU、メモリー、ストレージだけではなくソフトウェアをビルドするGitHub Actionsなども無償で利用できる。この方針は創業初期から変更されておらず、Microsoftに買収されるまではGitHubのビジネスにとっては負担だったであろう。しかし年々増加するオープンソースソフトウェアとそのソースコードを生成型AIの学習データとして利用することで、お荷物だったオープンソースのソースコードやテストコードなどが価値に変わり、Microsoftもそのブランディングに相乗りしてCopilotというブランドが築き上げられたというのが筆者の認識である。
基本として公開されているソースコードを人間のデベロッパーが読むのではなく、生成型AIが読み込むことで学習を行い、蓄積されたデータを使ってコード生成のアシスタントがデベロッパーのプロンプトに従ってコードを生成する機能を提供することで、オープンソースのコニュニティだけではなく課金ユーザーである企業内のデベロッパーにも価値を提供している。無償ユーザーであるオープンソースコミュニティ、有償ユーザーである企業内のデベロッパー、そしてGitHubそれぞれが価値を得る絶妙なエコシステムが完成していると言えるだろう。
ここからはCopilotの新しい部分について解説することになった。
その前にPythonがGitHubの上で最も多く使われているプログラミング言語になったと紹介し、Copilotを使って機械学習のためのコードをPythonで書くことが増えていると語った。
コード生成というこれまでCopilotが担っていた部分については、単にAIの機能が追加されただけではなくすべての機能にAIが埋め込まれたAI-nativeになり、会話によってコード生成を行っていた部分はAIがエージェントとして広くカバーするようになり、複数の大規模言語モデルを選択して使えるようになるという状態を、Dohmke氏はフェーズ2と呼んでいるわけだ。
そしてモデルを選択可能という部分では、これまでのOpenAIのGPTモデルだけではなく新たにAnthropicのClaude 3.5 Sonnetが使えるようになったとして、Anthropicの共同創設者Jared Kaplan氏を招いて発表を行った。
ここからはGitHub社員がデモを交えてCopilotの新機能を解説するフェーズに移った。
デモはCopilot Airwaysという架空のエアラインのWebサイトを題材にしてアプリケーションに機能を追加していくというシナリオだ。使うツールはMicrosoft Visual Studio Code、使用する言語はTypeScriptだ。Copilotに修正に関する質問を行い、生成されたコードを使って機能を追加する中で複数のファイルに同時に修正を行うという機能をデモ。単に機能を実装するだけではなく、どのファイルに修正が必要かまでをCopilotが理解しているというのがポイントだろう。またフィーチャーフラグを使って実験的な機能のオンオフを可能にするための修正や必要なライブラリーの挿入などもデモで紹介された。
また企業によってはコード自体に独自の記法やルールがある場合を想定して、カスタムインストラクションとしてカスタマイズできることを紹介。フィーチャーフラグはこのカスタムインストラクションを応用した実装となる。また細かい話だが、Macintoshを開発マシンとして使う場合にApple製の開発環境Xcodeもサポートされることが発表された。
次に紹介されたのは複数の大規模言語モデルを選択できるGitHub Modelsだ。
デモでは実際にMistralの異なるモデルを使って同じプロンプトで質問を行い、その結果を見せた。サンフランシスコの紹介文を生成させたが、モデルによってやや異なる内容となった。同じプロンプトで異なる結果を左右に並べて見せるのは効果的な見せ方と言えるだろう。
そしてGitHub Modelsはすべてのユーザーに公開が始まったとして、待ち行列に登録する必要がなくなったことも発表された。
次に紹介されたのはGitHub Copilot Workplaceだ。単にコード生成のアシスタントからデベロッパーがやりたいことを提示するとそのための準備をステップごとに解説し、最後の実装の部分までを助けるという機能がCopilot Workplaceの主な機能で、Spec Agent、Plan Agent、Implementation Agentという3つのエージェントがそれぞれのステップのアシスタントとして機能する。
開発されたプログラムはGitHub Codespacesというクラウドの中で実行されるというのが2024年10月時点の実装形となるが、Webアプリのためのプロトタイプとしては十分な環境だろう。Workplaceはデベロッパーがやりたいこと(実装すべき機能の外部仕様)をCopilotに質問してその提案を聞く、選択して実際に実装するまでをデモとして見せた。実装の前に機能を修正したり追加したりすることも可能であり、その場合は文脈を維持したまま質問するとそれがプランに反映されるようだ。また必要なテストも書いて実行し、エラーが見つかったら修正方法を提案してくれるところまでをデモ。途中のステップで複数の選択肢を提示する機能やテストのエラーに対しての修正方法を提案するなど、いかにもデベロッパーが欲しがる機能を実装しているところにベータユーザーの声を十分に反映していることを感じた。
そこから再度CEOのDohmke氏が登壇し、GitHub Sparkを紹介。
ここではプログラミング言語を知らない人でもゲームを開発できるというデモを、Dohmke氏自身が実際にノートPCを使って行ってみせた。ゲーム自体はTikTakToeというシンプルなものだが、自然な英語で作りたいゲームの仕様を説明するだけで即座に生成型AIがゲームのソースコードを書き、それをビルドするというところまでを見せた。これはプログラミング言語を知らない人にもプログラミングを始めるエントリーポイントとして最適であると説明。これによって10億人がプログラミングを行えるようになることを目指すと説明した。
Sparkの説明として「The AI-native tool to build apps in natural language」というコピーが使われているが、これはSparkが決してローコード/ノーコードのためのソフトウェアではないことを表明していると思われる。生成されたコードがGitHub上で参照できることはGitHubのCOOのKyle Daigle氏のインタビューでも説明された。
ここまで単なるコード生成のアシスタントとして出発したCopilotがデベロッパーの開発プロセスの多くのところで活用できることを見せつけたキーノートとなった。
しかしGitHubの発想は一人のデベロッパーがAIの力を借りてコード記述作業を省力化する、調べものを減らすなどの個人の作業を代行する、支援するというレベルに留まっており、ソフトウェア開発がグループワークであるというところから意図的に離れているように思える。機能を実装するアプリケーションデベロッパーもいれば、セキュリティ担当もそのアプリケーションの性能を担保するインフラストラクチャー担当も品質管理の部門も存在する組織の中で、Copilotを使えば独りですべてが可能になるような幻想は持つべきではないだろう。現実に自社の開発体制、自動化の状況と照らし合わせて、何が利用できるのかをユーザーが冷静に考えることが必要なのではないだろうか。
Copilotの新機能に拍手喝采を送る参加者の中で最後に思いついたのが「冷静になれ」という感想だったのは皮肉のように思える。GitHubがグループワークによるソフトウェア開発に意識を向けるまで注目し続けたいと思う。