月刊Linux Foundationウォッチ第50回

デジタル通貨やオープンソースAIなど、LF主催「Open Source Summit Japan」におけるJim Zemlin氏の講演を振り返る

2024年11月29日 6:31

こんにちは、吉田です。10/28、29に東京・虎ノ門で「Open Source Summit Japan」が開催されました。今回は、本イベントで登壇したLinux FoundationのExecutive DirectorであるJim Zemlin氏の基調講演の中から、興味深い内容をピックアップして紹介します。

基調講演では、まず過去30年の間でオープンソースが果たしてきた役割についての説明があり、オープンソースなしで、すべてのイノベーションが実現されていないのではないか、という説明があった後、Linux Fondationが注目している5項目のホットトレンド(下図)について説明されました。

「中央銀行デジタル通貨」について

「デジタル通貨」とは、円や米ドル、インド・ルピーなどのデジタル版を作成するために使用されるもので、これらはブロックチェーン技術を使用して構築されています。これまで主に暗号通貨、例えばイーサリアムやビットコインなどで見られてきましたが、世界中で徐々に規制当局がデジタル通貨の有用性が理解されるようになってきたことで、政府が規制するデジタル通貨が暗号通貨の利便性をすべて実現できることに気づきつつあります。

デジタル通貨がどのように作られるのかを透明性を持って探求する上で、オープンソースは非常に有効な手段です。Linux FondationのHyperLedgerプロジェクトは世界中の中央銀行デジタル通貨の取り組みで利用されており、大きな注目を集めています。インドでは、このデジタルルピーの試験運用が急速に広がり、HyperLedger技術の活用が進められています。

「地政学リスク」について

Linuxカーネルの上級リーダーであるGreg Kroah-Hartman氏は「さまざまなコンプライアンス要件」を理由に、ロシアのLinuxメンテナー数人が役割から外されたことをパッチで発表しました。

本件に関しては、オープンソースが非常に重要な存在になってきたことでEUのCRA法など世界中の法律や規制の対象となっており、私たちのコミュニティの多くの個人とは異なり、時には世界の政府はうまくやっていけず、ルールを制定し、制裁を課すことがあります。「私たちは居住地またはオープンソースに参加している取引先の居住地においては従う必要があり、これがLinuxカーネルプロジェクトで起こった」という説明がありました。これは必ずしも開発者を締め出したいということではなく、その技術者が誰なのかを理解する必要があるのではないかということでした。

「オープンソースAI」とは

AIに関連して「オープンソースであるということはどういうことなのか」という議論がさまざまな場所で起こっています。そもそもオープンソースイニシアチブが定めた「オープンソースの定義」は、著作権ライセンスに焦点を当てています。「オープンソースAI」は従来のオープンソースの定義を超えて異なる視点から考える必要があり、オープンソースAIを定義する必要があります。そうすれば、あるレベルのオープン性を理解した上で、例えばLama 3のようなものにアクセスしている場合、それは従来の意味でのすべてのコンポーネントがオープンな純粋なオープンソースの科学データモデルとは異なる可能性がありますが、この取り組みを通じて、本当に、より簡単でより正確なオープン性を表現する方法が得られます。

「Linux Foundationで私たちが取り組んだのは、いくつかの明確な分野における標準的な定義の作成を支援するオープンなフレームワークモデルの作成でした。いくつかの明確な分野で共通の用語を使用して標準的な定義を作成し、コラボレーションを可能にするというものです。また、この情報は規制当局に一貫した標準的な方法で情報を提供することにも役立ちます。そこで、オープンAIについて考える際に重要なのは、AIモデルの作成に使用されるさまざまなコンポーネントがどの程度オープンであるかということです。重み付け、アーキテクチャ、モデルのトレーニングに使用されるデータなど、使用されているライセンスが制限付き使用、修正、配布などであるかどうかです」

「オープンソースソフトウェアを使用してAIモデルを構築する一方で、オープンソースソフトウェアを使用してAIモデルを構築する際には、完全にオープンであるとは限らない他のコンポーネントも使用することになります。そこで私たちが発見したのは、AIに関してオープンであるかどうかという観点で2つの主なカテゴリーがあるということです」

「1つ目はオープンサイエンスAIモデルです。私たちは今週、このテーマに関する最新ホワイトペーパーを公開しました。LF AI Big Dataのウェブサイトにアクセスしてご覧ください。オープンサイエンスAIモデルとは、私たちが定義するものでモデルを構築するために使用されるすべてのコンポーネントが、本当にオープンソースであることです。その中には、ソースコード、トレーニングデータ、すべての研究、そのモデルの完全な再現に必要なすべてのものが含まれます」

オープンソースの「セキュリティ」

今年の始めに起こった「XZ攻撃」について言及がありました。Linuxで使用されている圧縮ライブラリのプロジェクトで”Jia Tan”というエンジニアがコミュニティ内での評判を築き上げコミットできるようになりましたが、そのエンジニアがバックドアを仕掛けたという事件です。たまたま、マイクロソフトの開発者がそのプロジェクトでCPUの異常な動きを発見し、Linuxディストリビューションのメジャーリリースに組み込まれる前にバックドアを見つけました。もう少しで世界中の何百万ものシステムに重大なバックドアが仕掛けられるところでした。

これと似たような案件がOpenJSコミュニティでも起きており、オープンソースコミュニティにとって大きな脅威となっています。すべてのオープンソースコミュニティが、コミュニティ内の相互信頼を確立する方法を改善できるルールを作成する必要があることを示唆しています。