KubeCon Europe 2024開催。前日に開催されたAIに特化したミニカンファレンスを紹介

2024年5月9日(木)
松下 康之 - Yasuyuki Matsushita
KubeCon Europe 2024の前日に開催されたAIに特化したミニカンファレンスを紹介する。

OpenShift AIの事例

次に紹介するのは2024年2月にRed HatのOpenShift AIのチームが来日した時にインタビューを行ったChristopher Nuland氏と、ELOTLのVP of EngineeringであるSelvi Kadirvel氏がKubernetesのマルチクラスターを管理するFleet Managerを使って実装した事例に関するセッションだ。

プレゼンテーションを行ったのはELOTLの Kadirvel氏とRed HatのNuland氏

プレゼンテーションを行ったのはELOTLの Kadirvel氏とRed HatのNuland氏

ちなみにFleet ManagerはAWSのシステム管理の機能としても知られているが、この場合はELOTLのマルチクラウド用コントロールプレーンであるNovaの機能を指している。

●参考:Nova: A Policy-Driven Multi-Cloud Multi-Cluster Orchestrator

マルチクラウドを利用する上で一般的なWebアプリケーションではなく、機械学習に使われることを想定して大量のデータをオンプレミス、パブリッククラウドで使い分ける際にクラスターの選択をFleet Managerで行い、クラスター内のワークロードの管理はKubernetesに任せるという発想だろう。

Fleet Managerの解説。ここではクラスターを管理する役割がFleet Managerの仕事

Fleet Managerの解説。ここではクラスターを管理する役割がFleet Managerの仕事

その上で実装段階において必要な仕事とシステムが立ち上がった後で運用として必要な仕事について解説し、ワークロードの処理時間がWebアプリとは異なる性格を持つことを指摘。特にポイントとなるのが、ジョブに必要なリソースをどうやって確保するのか? だと説明した。

生成型AIのアプリケーション実装のためのパイプラインを説明

生成型AIのアプリケーション実装のためのパイプラインを説明

ここで機械学習においてはデータの整備、モデルの学習、モデルのチューニング、データの埋め込み、推論、モデルの評価などのプロセスが、パイプラインとして整備されていることが必須となることを説明した。

そして新薬開発のためのユースケースを想定して、エンドユーザーであるリサーチャーが対話型のアプリケーションを通じて生成型AIを使う場合のフローを紹介した。

新薬開発のためにRAGアプリケーションのフローダイアグラムを解説

新薬開発のためにRAGアプリケーションのフローダイアグラムを解説

その際にデータベースが集約されているWebアプリケーションとは違い、その都度、大量なデータセットを用意する必要がある生成型AIのアプリケーションにおいてはデータがどこにあるのか? が重要になるとして、Data Gravityについて解説。ここではアプリケーションが必要とするデータをどうやって近接に持ってくるのか? が重要だという論点だ。

生成型AIにおける「データの近さ」をData Gravityとして説明

生成型AIにおける「データの近さ」をData Gravityとして説明

他の業界のアプリケーションと比べて、医療関連のシステムにおいて「データの近さ」が重要になることを業界の識者だと思われるTony Bishop氏のコメントを引用して説明している。遅延を想定すればどのアプリケーションでも遅延が少ないほうが好ましいのは当たり前だが、どうして医療関係においてそれが重要になるのか? という部分については特に説明がなかったのは残念である。

RAGアプリケーションにおいてデータが近くにあることが重要と説明

RAGアプリケーションにおいてデータが近くにあることが重要と説明

対話型で実行されるRAGアプリケーションにとって遅延は少ない方が良く、そのためにはデータの整備から始まるパイプラインも同様に近いデータセンターで処理されるほうが良いと説明。

そのためには1つのデータセンターに集約するのではなくマルチクラウド、オンプレミスとパブリッククラウドを想定して実装されることが重要だというのがRed Hatの論点だ。そのため透過的に複数のクラウドを操作できるFleet Managerのようなツールが必要となるというのがこのプレゼンテーションのゴールということだろう。

医療関係のRAGアプリケーションにはFleet Managerが必要

医療関係のRAGアプリケーションにはFleet Managerが必要

そして複数のクラウドを使い分ける簡単なデモを実施。ここではコマンドラインから操作し、複数のクラウドを使い分けていることを示した。

最後にまとめとしてELOTLのFleet ManagerのダウンロードサイトのURLを示しながら、複数のクラウドを使い分けることが遅延の少ないRAGアプリケーションにおいては重要であり、ELOTLのNovaはその候補になり得ることを説明してセッションを終えた。

全体としてELOTLのFleet Managerを使うことを前提として組み立てられており、単一のパブリッククラウドを使った場合との速度比較などがなかったのが残念だったと言えよう。RAGアプリケーションのようにユーザーが即座にその結果を手にすることができることが重要なアプリケーションの特性と、データのロケーションとの相関関係についてもっと深い解説をして欲しかった。

セッションの動画は以下から参照できる。

●動画:Gen-AI at Scale: Simplifying Orchestration of Healthcare Applications Across Multi-Cluster

著者
松下 康之 - Yasuyuki Matsushita
フリーランスライター&マーケティングスペシャリスト。DEC、マイクロソフト、アドビ、レノボなどでのマーケティング、ビジネス誌の編集委員などを経てICT関連のトピックを追うライターに。オープンソースとセキュリティが最近の興味の中心。

連載バックナンバー

クラウドイベント
第13回

写真で見るKubeCon Europe 2024 ベンダーやコミュニティプロジェクトの展示を紹介

2024/6/20
KubeCon+CloudNativeCon Europe 2024の展示ブースをまとめて紹介する。
クラウドイベント
第12回

KubeCon Europe 2024に日本から参加したメンバーで座談会@桜の木の下

2024/6/17
KubeCon+CloudNativeCon Europe 2024に日本から参加したエンジニアに集まってもらい、座談会を実施した。
セキュリティイベント
第11回

KubeCon Europe 2024にて、グラフを用いてSBOMを可視化するGUACのコントリビューターにインタビュー

2024/6/13
KubeCon Europe 2024にて、SBOMを可視化するツールGUACのコントリビューターにインタビューを実施した。

Think ITメルマガ会員登録受付中

Think ITでは、技術情報が詰まったメールマガジン「Think IT Weekly」の配信サービスを提供しています。メルマガ会員登録を済ませれば、メルマガだけでなく、さまざまな限定特典を入手できるようになります。

Think ITメルマガ会員のサービス内容を見る

他にもこの記事が読まれています