生成AIのためのコンポーネントをパッケージングするKitOpsの解説動画を紹介

2025年4月10日(木)
松下 康之 - Yasuyuki Matsushita
CNCFのWebinar動画から、生成AIなどで散在するアーティファクトをパッケージングするKitOpsを紹介。

Cloud Native Computing Foundation(CNCF)が公開しているWebinarから、生成AIのパッケージングの標準を目指してオープンソースとして公開されているKitOpsの解説動画を紹介する。タイトルは「KitOps:AI Model Packaging Standards」、プレゼンテーションを行ったのはBrad Micklea氏でKitOpsプロジェクトのメインテナーだ。Jozu.comは機械学習アプリケーションをパッケージングするオープンソースソフトウェアであるKitOpsの開発元で、すでにCNCFのサンドボックスプロジェクトに採択されるべく2024年11月のKubeCon NAのタイミングでCNCFに申請を行っている。

●動画:KitOps: AI Model Packaging Standards

●参考:We're submitting KitOps to the CNCF - Jozu MLOps

日本人ならピンと来る通り、Jozu.comという名称は日本語の「上手」が由来だそうだ。

KitOpsが何を目指しているのかについてはJozu.comのWebサイトに掲載されているダイアグラムがわかりやすいだろう。

JozuはAI/MLアプリケーションをパッケージし、実装するためのプラットフォーム

JozuはAI/MLアプリケーションをパッケージし、実装するためのプラットフォーム

機械学習のための開発、ここではJupyter Notebookを使ってデータを処理するコードを書いてモデルの学習を行うことを例として挙げているが、その後の行程としてコードのパッケージ、検証、本番環境への実装までをJozuが担い、推論と運用はその後のプロセスが担当するというフローが描かれている。つまりデータサイエンティストの仕事と運用担当の仕事の間を、Jozuがプラットフォームとして受け持つということになる。その際のパッケージの部分をKitOps、より正確にはOCI準拠のパッケージフォーマット、ModelKitというパッケージが使われるという意味だろう。

ただ、ここで少しわかりづらいのは、Jozuはプラットフォームであり、OSSのKitOpsをそのツールとして使い、Jozu.comはSaaSとしてJozuのホスティング、より正確に書けばKitOpsが利用するパッケージフォーマットのModelKitをホストする有償のサービスであるということだろう。またJozuはドバイに本社を持つAkara Technologies, Inc.がオーナーシップを持つとJozu.comのサイトには記載されているため、Akara TechnologiesがJozu.comに出資を行っているという意味だと想定できる。Brad Micklea氏はその投資を受ける側の責任者という立場だろう。

JozuはKitOpsをツールとしてサポートし、ModelKitをパッケージングフォーマットとして使う

JozuはKitOpsをツールとしてサポートし、ModelKitをパッケージングフォーマットとして使う

この2つのスクリーンショットはJozu.comのサイトからの引用なので、より正確に理解したい場合はJozu.comを参照して欲しい。

●参考:https://jozu.com/hub/

具体的に何をすればいいのか? については以下のチュートリアルが参考になるだろう。

●参考:A Guide to Machine Learning System Design and Best Practices

KitOps:機械学習のためのOCIに準拠したパッケージング」というタイトル

KitOps:機械学習のためのOCIに準拠したパッケージング」というタイトル

ここで機械学習において必要とされるモデル、パラメータ、データセット、そしてそれらを操作するプログラムコード、さらにこのアプリケーションを解説するドキュメントなどの成果物(Artifact)が、さまざまなリポジトリに散在するという状況が問題を発生させていると解説。通常のソフトウェアとは異なり、モデル、パラメータ、データセットが生成AIにおいては重要だが、それが企業においてはコンプライアンスの問題やデベロッパーのマシンでは動くのに本番環境では動かないといった環境依存問題に繋がると指摘した。

散在する成果物に由来する問題点を指摘

散在する成果物に由来する問題点を指摘

そしてモデルのバージョン管理、構成管理が一元的に行えないことで生成AIを実装し、追跡監視することが難しいというコメントを使って、この問題が想像上のものではないことを紹介した。もっとも、ここでコメント主の実名や企業名が明らかにされていないのは残念と言える。

物流会社のデータサイエンティストのコメントを引用

物流会社のデータサイエンティストのコメントを引用

続いて、上述の問題を解決するためのツールであるKitOpsを紹介。KitOpsの中核はOCIに準拠したコンテナフォーマットであるKitModelであると解説。ここで重要なのは、AI開発のためにこれまで使ってきたツールはそのまま使えることだろう。ツールはそのまま使いながら、成果物をOCIでパッケージすることで成果物の統一的な管理が可能になるというのが利点だ。

KitOpsでAIと機械学習の成果物を統一的に管理

KitOpsでAIと機械学習の成果物を統一的に管理

実際の使用例として、JozuのユーザーインターフェースでDeepSeek-R1をパッケージする部分を紹介した。ここではKitModelの中身としてDeepseekを使い、OCI 1.1に準拠したレジストリーからコンテナイメージをプルしている。

Jozuのインターフェースからモデルのパッケージングの例を紹介

Jozuのインターフェースからモデルのパッケージングの例を紹介

ModelKitの中身を紹介

ModelKitの中身を紹介

さらにModelKitをどこで実行するのかについてはDocker、Kubernetesなどから選択し、実装に必要な構成情報もYAMLの形式で格納できることを解説。単にパッケージングするだけではなくその実装についても情報を取り込むことが可能になっている。

ModelKitの利点をリストアップ

ModelKitの利点をリストアップ

改ざんに対して耐性が高く、署名を行うことが可能で属性を可視化し、生成AIのための唯一の情報源となれることを説明した。そしてこれまで機械学習のための成果物を検証可能にするためにリポジトリをフォークして自社のセキュアなストレージに格納していたというドイツのシステムインテグレータのコメントを引用し、KitOpsによってその必要がなくなったことを紹介した。ここでもコメント主が匿名になっているのは残念だ。

ここでも匿名のコメントを引用。KitOpsで成果物を毎回コピーする必要がなくなったという

ここでも匿名のコメントを引用。KitOpsで成果物を毎回コピーする必要がなくなったという

KitOpsのようなAIの成果物を統一的に管理することの必要性については、ビジネス側のニーズとソフトウェア開発における技術的なニーズが高まってきたことが背景にあると解説。特にここではヨーロッパのAIに対する規制や問題発生時の補償について言及されている辺りに、生成AIがビジネスに与えるインパクトの大きさを示していると言える。

どうしてKitOpsが必要になったのかをビジネスとテクノロジーの両面から考察

どうしてKitOpsが必要になったのかをビジネスとテクノロジーの両面から考察

KitOpsと同じような機能を果たすツールやサービスについても比較を行っている。ここではGitLab、SonatypeのNexusリポジトリ、Hugging Face、MLFlowのツールなどを比較対象として評価している。ここでの指標はベンダーニュートラルでオープンなフォーマットかどうか、すべての成果物を管理できるかどうか、巨大なモデルやデータセットを管理できるか、そして自動的に実装可能なプロジェクトに変換できるか、などを挙げている。

KitOpsと他のツール、サービスとの比較

KitOpsと他のツール、サービスとの比較

ここから2枚のスライドでは、企業の中でAI/機械学習アプリが開発から実装されるまでのプロセスを分解しながら、KitOps(ModelKit)とプラットフォームであるJozuの役割を解説した。プラットフォームエンジニアが機械学習のための環境を用意するとことから始まっているのは、ModelKitのテンプレートを紹介したかったということだろう。その上でJupyter Notebookを使ってモデルを開発、MLFlowでテスト、そのテストに合格したらAIを利用する外部のアプリケーションを開発するデベロッパーに移行し、実行可能なイメージに変換したのちに本番環境に実装という流れだ。新しいバージョンのアプリケーションが出てきた時には、古いバージョンにタグを付けて古いバージョンであることを明示したうえで新しいソフトウェアと置き換えるというところまでを解説した。ここで環境を作る部分と最後に古いバージョンをリタイアさせるところまでが記載されているのは、常にデータセットやモデルが更新されていくのが生成AIにおいては必須であることを示しているといえる。

AI/機械学習アプリのライフサイクルを紹介

AI/機械学習アプリのライフサイクルを紹介

ライフサイクルの後半。緑の部分はJozuというSaaSで行われるという意味での区分けだろう

ライフサイクルの後半。緑の部分はJozuというSaaSで行われるという意味での区分けだろう

次のスライドではKitOpsの中核となるModelKitの内部構成について、Kitfile、Modelkit Manifest、モデル、コード、データセット、ドキュメントによって構成されていることを説明した。

ModelKitのレシピとなるKitfileとは

ModelKitのレシピとなるKitfileとは

ModelKitのレシピとなるKitfileについても例を示しながら説明を行った。

ModelKitの構成ファイル、Kitfileの中身を紹介

ModelKitの構成ファイル、Kitfileの中身を紹介

KitOpsがどれだけダウンロードされているのかについて、2023年4月から始まる折れ線グラフでその増加を紹介。4月から始まったダウンロード数は、2024年1月の段階で5万回に届く勢いで増えていると説明した。

KitOpsのダウンロード数の推移。4月から9ヶ月で5万回

KitOpsのダウンロード数の推移。4月から9ヶ月で5万回

この数字が多いかどうかは評価が分かれるところだが、少なくともAIと機械学習アプリの開発と運用を橋渡しするという空白地帯を埋めるという位置付けのソフトウェアとしては、健闘していると言えるのではないだろうか。

さらに、これまでのリリースについても解説を行った。ここでは2024年Q1からさまざまな機能追加が行われたこと、2024年Q4にCNCFにサンドボックスプロジェクトとして申請を行ったことなどが説明されたが、CNCFのAIにおけるモデルパッケージングに関する仕様策定にも関わっていることが示されているため、CNCFの標準仕様としてKitOps/ModelKitが採用される可能性は高いと想定するのが妥当だろう。

これまでのリリースの遍歴を紹介。2024年Q4にCNCFのサンドボックスとして申請

これまでのリリースの遍歴を紹介。2024年Q4にCNCFのサンドボックスとして申請

最後にKitOpsによって開発の繰り返しの間隔、つまり開発からテスト、実装を繰り返す際に必要となる最低限の時間についても解説し、平均で3.4日が削減されたと説明。ここに関しても、もう少し具体的にどのプロセスからどれだけの時間が削減できたのかを母数とともに解説してあれば、よりそのデータの信頼性が増しただろう。またリスクについてもコンプライアンス違反が防げた件数なども併せて紹介できていれば尚良いといったところだろうが、実際問題としてそこまで定量的な数値が取れていないというのが実態ではないだろうか。

KitOpsによって開発を繰り返す時間が3.4日削減できたと紹介

KitOpsによって開発を繰り返す時間が3.4日削減できたと紹介

生成AI、機械学習アプリケーションによって新たに生まれてしまった問題点を解決するために、OCIを使って成果物をパッケージングするKitOpsとそれを支えるSaaSとしてのJozuには、引き続き注目をして行きたい。

●KitOpsのGitHubページ:https://github.com/jozu-ai/kitops

著者
松下 康之 - Yasuyuki Matsushita
フリーランスライター&マーケティングスペシャリスト。DEC、マイクロソフト、アドビ、レノボなどでのマーケティング、ビジネス誌の編集委員などを経てICT関連のトピックを追うライターに。オープンソースとセキュリティが最近の興味の中心。

連載バックナンバー

AI・人工知能技術解説

生成AIのためのコンポーネントをパッケージングするKitOpsの解説動画を紹介

2025/4/10
CNCFのWebinar動画から、生成AIなどで散在するアーティファクトをパッケージングするKitOpsを紹介。
データベース技術解説

ClickHouseを使ったデータレイクの概要を解説する動画を紹介

2025/3/21
ClickHouseを使ったデータレイクの概要を解説する動画を紹介する。
セキュリティイベント

【いよいよ今週3/19開催!】ビジネスを守るセキュアな開発・運用事例に学ぶ「Think IT Day Security for Application」先着50名にAmazonギフト券1,000円分、100名に書籍をプレゼント!

2025/3/17
ThinkIT編集部は3/19(水)に東京・JA共済ビル カンファレンスホールで「Think IT Day Security for Application 〜 ビジネスを守るためのセキュアな開発・運用の道筋」を開催。

Think ITメルマガ会員登録受付中

Think ITでは、技術情報が詰まったメールマガジン「Think IT Weekly」の配信サービスを提供しています。メルマガ会員登録を済ませれば、メルマガだけでなく、さまざまな限定特典を入手できるようになります。

Think ITメルマガ会員のサービス内容を見る

他にもこの記事が読まれています