KubeCon Europe 2024、IntelのArun Gupta氏にインタビュー
KubeCon+CloudNativeCon Europe 2024にて、IntelのVPでKubeConではお馴染みのArun Gupta氏にインタビューを行った。過去にApple、AWSのプレゼンターとしてKubeConで何度もキーノートで登壇しているオープンソース界隈では有名人と言っても良い人材だ。事実Gupta氏の肩書は「Vice President and General Manager, Open Ecosystem」であり、オープンエコシステムという部分にオープンソースソフトウェアが含まれるということなのだろう。
さまざまな会合や取材で時間を取るのが難しかったGupta氏へのインタビューの中で、今回のカンファレンスの大きなテーマとなった生成型AIについて質問を行った。その背景には初日に行われたプレスカンファレンスでCNCFは生成型AIについて「倫理的に正しいAI」を実現することを目指すと説明があったことに対して、どのようにそれを実現するのか? を訊いてみたかったからだ。
このスライドはCNCFのエグゼクティブディレクター、Priyanka Sharma氏が使ったもので、「CNCFとコミュニティが協力して倫理的に正しいAIを作ることを目指す」と説明している。
今回の大きなテーマとして生成型AIが取り上げられていますが、ハルシネーション、つまりAIが間違った回答を行うことは大きな問題点として挙げられています。CNCFは生成型AIのコミュニティと一緒に倫理的に正しいAIを作ることを目指すと説明していますが、それはどうやって実現するのでしょうか? 生成型AIは、物理的な事項に関する正解を世界中どこの場所でも回答できると思いますが、政治的な質問に対する正しい回答はその質問が発生する国や地域によって異なるはずです。例えば「1989年6月4日に北京で何か事件が起こりましたか?」という質問を中国でしたら正しい回答は「何も起こらなかった。いつもの日常だった」となるでしょう。でも他の国では違う回答になるはずです。
これには複数のレベルで活動が行われていることを理解して欲しいと思います。CNCFの中ではAIについてのワーキンググループが結成されて「正しいAI」に関する活動が始まっています。LFでもAIとデータに関しての別のファウンデーション、LF AI & Data Foundationが結成されて包括的にAIを開発していこうとしています。AIが正しくあるべきだというのは、すべてのエンジニア、業界、社会が望んでいるものですが、それはひとつの活動で達成できるものではありません。それはすべての国においても同様で、これからさまざまな活動が行われていく中で実現していくものであるということです。ですので、複数のプロジェクトが同時並行して活動していることによって正しいAIが実現できると考えています。
AIのエンジニアやデータサイエンティストとKubernetesの運用担当者、クラウドネイティブなアプリケーションのデベロッパーでは仕事のやり方が違うはずです。今回、多くのセッションで生成型AIのワークロードをKubernetesのプラットフォームに載せるためのさまざまな努力が解説されていました。データサイエンティストにKubernetesのスタイルを無理矢理押し付けているということはありませんか?
クラウドネイティブなシステムのエンジニアと生成型AIのエンジニアは確かに仕事のやり方は違うでしょう。ただ求めていることは変わらないと思います。それは素早くコードを実装できること、変化に対応できるシステムであることであり、このような特性を求めている点については同じだということです。今、多くのイノベーションがクラウドネイティブなコンピューティングにおいて起きています。例えば想像してみて欲しいんですが、もしもKubernetesがなかったら、どんなプラットフォームで生成型AIが開発されていたんだろうと。ベアメタルなサーバーとデータベース、そしてOSに依存したアプリケーション、そういうプラットフォームで生成型AIが実現できていたとは思えませんよね。クラウドネイティブなシステムはさまざまなビジネスに必要とされています。生成型AIもそのようなシステムの上で開発、実行されることでより良いものになっていくと信じています。
クラウドネイティブなシステムは仮想マシンからコンテナ、そしてサーバーレスと言うようにシステムの実行単位がどんどん小さくなってリソースを有効活用しやすくなっていっています。ただ生成型AIでは「いかに多くのワークロードをGPUに詰め込むか?」が重要となっています。でもこれは自社がGPUを所有している場合には正解だと思いますが、パブリッククラウドを想定するとGPUに対するコストが増加してしまいます。このような問題に対してはどう考えますか?
プロセッサーを効率的に使うことは生成型AIに限らず重要ですね。またGPUが生成型AIでは重要だと多くのエンジニアは信じていますが、それは必ずしも正解ではありません。GPUは学習のフェーズにおいては効率の良いプラットフォームですが、推論を実行する際にはさまざまな選択肢があると思っています。実際にCPUだけで学習から推論実行までを行う場合もありますし、推論実行にはFPGAが有利である場合もあります。その場合には、アプリケーションがアーキテクチャーを意識せずに開発、実行できることが重要になります。これの実現を目指しているのが、2023年の9月に発表したUXL Foundationです。これはCPUやGPU、FPGAなどのアーキテクチャーが異なるプロセッサーやアクセラレーターに共通のAPIを提供することで、デベロッパーが違いを意識せずにソフトウェア開発を行えることを目指しています。
この他にも「どうしてNVIDIAはCNCFのスポンサーにならないんでしょうね?」という質問にも「NVIDIAのことはわからないしコメントもできないが、彼らには彼らなりの事情があるんじゃないのかな? Intelは20年以上もオープンソースにコミットしているよ」という優等生なコメントが返ってきた。ARMやIntel、Qualcommなどが参加するUXL Foundationが、今後どのように発展していくのか注目していきたい。
連載バックナンバー
Think ITメルマガ会員登録受付中
全文検索エンジンによるおすすめ記事
- KubeCon Europe 2024に日本から参加したメンバーで座談会@桜の木の下
- エッジでKubernetesを実装する新しいプラットフォームをIntelとSpectro Cloudが紹介
- 写真で見るKubeCon Europe 2024 ベンダーやコミュニティプロジェクトの展示を紹介
- KubeCon Europe 2024開催。前日に開催されたAIに特化したミニカンファレンスを紹介
- KubeCon EUのRISC-Vのキーノートから見えるKubernetes的なオープンハードウェアとは
- 参加者から見たKubeCon Europe 2023のようすを紹介
- KubeCon Europe 2024、ID管理のVenafiのVPにインタビューを実施。マシンID管理とは?
- KubeCon China開催。DPDKとCI/CDのプレカンファレンスを紹介
- KubeCon Europe 2024からWASMとeBPFを使ってストリーム処理を解説するセッションを紹介
- KubeCon Europe開催、16000人が参加し、ヨーロッパで最大のテックカンファレンスに