The Cloud Native Computing Foundationが主催するフラッグシップカンファレンス、KubeCon+CloudNativeCon North America 2025がジョージア州アトランタで2025年11月10日から13日まで開催された。この稿では11月11日に行われたキーノートの前半を紹介する。KubeConは3日間の日程だが、実際には前日にCo-located EventとしてセキュリティやAIなどのテクノロジーやプロジェクトに特化したミニカンファレンスが行われている。そのためそれらのイベントにも参加している筆者のような参加者にとっては2日目ということになる。
キーノートの内容をざっくりと要約すると、10年目を迎えたCNCFの振り返りから始まり、AIとクラウドネイティブの融和性からAIワークロードをクラウドネイティブなプラットフォームの上で稼働させるための適合テストの導入を、デモを交えて紹介。その後はCNCFのプロジェクトに対するセキュリティオーディットの状況、Kubernetesのコアとも言えるetcdに対して自動テストを実施したベンダーがCNCFのパートナーとなり、配下のプロジェクトに対して自動テストを順次実施していくことの発表、そして最後に2026年、2027年のカンファレンスの日程と場所を公表したという内容となっている。
KubeConでは往々にして、初日のキーノートではCNCFが重要だと考えるテクノロジーや新しいプログラムの紹介、2日目はオープンソースコミュニティ、3日目はユーザーやベンダーのトークというようにかなり色付けがはっきりしている。そのため、CNCFの方向や何を重要だと考えているのかを知るためには、初日のキーノートが重要だと言える。42分のキーノートセッションは以下のリンクから視聴できる。
●動画:Keynote: Welcome + Opening Remarks
Bryce氏はCNCFのエグゼクティブディレクター、Aniszczyk氏はCNCFのCTOでKubeConのキーノートのMCとしてはお馴染みのエグゼクティブだ。
CNCFは2015年7月に結成され、10周年という組織だが、最初のボードミーティングはニューヨークのマンハッタンにあるNew York Timesのオフィスを借りて行われたと紹介。そこから29万人のコントリビューターが335万回のコミットを行ったという現在に至るという実績を解説した。ここでは230以上のプロジェクト、190以上の国や地域から参加しているグローバルなエコシステムに成長したことを強調した。
多数のプロジェクトがSandboxからIncubate、そしてGraduationしていく中で2025年はin-toto、Knative、Crossplane、Dragonflyが、成熟したプロジェクトであることを示すGraduationというステータスになったと説明した。
他にもGraduationから10年を経過したプロジェクトは多数あることを説明し、CNCFとして単にプロジェクトをホストしてGraduationさせるだけではなく、継続的に支援を続けていることは後半の解説の中で詳しく説明される。
このスライドの下段中央でPrometheusとFluentdには挟まれているのがetcdのロゴだ。etcdはKubernetesの状態を保持する分散キーバリューストアデータベースだが、後半でソフトウェアが安定して稼働できるかどうかのテストが行われたことが解説される。このテストは第三者であるAntithesisというベンダーが実施したものである。
ここからクラウドネイティブなシステムと、生成AIのような最先端のAIが融和していくということを説明するフェーズに移った。
ここではCNCFが行ったリサーチからAIのデベロッパーの多くがクラウドネイティブなシステムの上で開発を行っていることを示した上で、オープンソースなAI開発において重要なポイントを解説した。
スライドで3つの柱と説明されているのは、学習、推論、そしてエージェントだ。最初の柱であるモデルを学習するフェーズにおいて、PyTorchが80%のシェアを持っていることを強調し、推論においては多くの推論のためのフレームワークが公開されていること、またエージェントにおいてはMCPに代表されるオープンなテクノロジーが業界をリードしていることを論拠として挙げている。
その中から次のスライドで紹介したのはAIBrixとllm-dだ。
vLLMはUC BerkleyのSky Computing Labが開発し、オープンソースとして公開したPythonのための高速推論ライブラリーである。llm-dはそのvLLMをベースにしたKubernetes用のフレームワーク、またAIBrixはByteDanceが開発したvLLMをKubernetes上で実行するためのフレームワークである。ほぼ機能が被るプロジェクト双方をここで紹介するというのは興味深いが、CNCFは複数のプロジェクトが同じ領域に存在しても競わせることが健全で透明性の高い方法だと意図している節が往々にして見られる。そのため今回も、そういう発想で競合する2つのプロジェクトを紹介したということだろう。ちなみにvLLMとAIBrixは、ロンドンで行われたKubeCon Europe 2025の3日目のキーノートでも紹介されている。詳細については以下の記事を参照して欲しい。
●参考:KubeCon Europe 2025、3日目のキーノートでGoogleとByteDanceが行ったセッションを紹介
またGPUリソースの最適化についてはKubernetesの機能としてDRA(Dynamic Resource Allocation)がバージョン、1.34からGAという状態になったことを紹介。KueueというKubernetesのSIG配下のGPUなどのスケジューリングを行うプロジェクトも存在するが、ここでは省略されている。
そしてここからはKubernetes上のAIワークロードに対するConformanceテストに関する内容となった。プレゼンターはGoogleのJanet Kuo氏だ。
Kuo氏はKubernetes上のAIワークロードが、各社が展開するKubernetes上で高い移植性を保つための施策としてKubernetes AI Conformance Programが正式に開始されたことを説明。これはどのプラットフォームでもKubernetes上でAIワークロードが移植され実行可能にあることを保証するテストであり、GitHub上ではそのテストコードを参照できるようになっている。
●参考:https://github.com/cncf/k8s-ai-conformance
●CNCFのプレスリリース:CNCF Launches Certified Kubernetes AI Conformance Program to Standardize AI Workloads on Kubernetes
Kuo氏はコマンドラインでのデモの動画を見せながら実際にDRAによってGPUが分割されていることなどを見せて、コードがどのプラットフォームでも実行できる移植性の高さが必要だと訴えた。
その上でこのプログラムに初期から参加しているCNCFのメンバーを紹介。
ちなみにKubernetes自体のConformanceプログラムの初期メンバーについては、以下のスライドを参照して欲しい。
ここでわかるのは、AI Conformanceの方には中国のクラウドプロバイダーが参加していることだ。中国はThe Apache Software Foundation配下ビッグデータプロジェクトやAI関連のオープンソースプロジェクトに大きな貢献をしている。中国国内で流通している多数のオープンソースプロジェクトを活用して独自の進化をしている状況から判断して、AIワークロードの適合性や移植性をCNCFがどう考えているのかを知るために参加したという発想かもしれない。
キーノートの後半の内容は次の稿で紹介する。
- この記事のキーワード