Zyphra、小規模言語モデル「Zamba2-7B」をリリース
2024年10月16日(水)
Zyphraは10月14日(現地時間)、小規模言語処理モデル「Zamba2-7B」をリリースした。
「Zamba2-7B」は、デバイス上やコンシューマGPU上で実行するための主要モデルであり、かつ自然言語タスク向けのコンパクトで効率的なモデルを必要とするエンタープライズアプリケーションにも適した言語モデル。「Transformer」アーキテクチャと「Mamba」アーキテクチャのハイブリッドとして構成されている。
「Zamba2-7B」では、推論効率が向上しており、Llama3-8Bなどのモデルと比較して、最初のトークンまでの時間が25% 高速化され、1秒あたりのトークン数が20% 向上し、メモリ使用量が大幅に削減された。また、「Mamba1」ブロックは「Mamba2」ブロックに置き換えられている。
「Zamba2-7B」は、「Apache 2.0 License」の下で公開されている。
Zamba2-7B
「Zamba2-7B」は、デバイス上やコンシューマGPU上で実行するための主要モデルであり、かつ自然言語タスク向けのコンパクトで効率的なモデルを必要とするエンタープライズアプリケーションにも適した言語モデル。「Transformer」アーキテクチャと「Mamba」アーキテクチャのハイブリッドとして構成されている。
「Zamba2-7B」では、推論効率が向上しており、Llama3-8Bなどのモデルと比較して、最初のトークンまでの時間が25% 高速化され、1秒あたりのトークン数が20% 向上し、メモリ使用量が大幅に削減された。また、「Mamba1」ブロックは「Mamba2」ブロックに置き換えられている。
「Zamba2-7B」は、「Apache 2.0 License」の下で公開されている。
(川原 龍人/びぎねっと)
[関連リンク]Zamba2-7B
その他のニュース
- 2024/12/14 AWS、「Data Exports for FOCUS 1.0」の一般提供を開始
- 2024/12/13 Linuxディストリビューション「OpenMandriva Lx 24.12 "ROME"」リリース
- 2024/12/11 オープンソースのエミュレーター「QEMU 9.2」リリース
- 2024/12/10 systemdの代替を目指すサービスマネージャ「GNU Shepherd 1.0」リリース
- 2024/12/9 軽量なLinuxディストリビューション「manjaro 24.2」リリース
Think ITメルマガ会員登録受付中
Think ITでは、技術情報が詰まったメールマガジン「Think IT Weekly」の配信サービスを提供しています。メルマガ会員登録を済ませれば、メルマガだけでなく、さまざまな限定特典を入手できるようになります。
全文検索エンジンによるおすすめ記事
- 大規模言語モデルの自然言語処理「Transformer」モデルの仕組み
- HPE、小規模システム向けコンパクトサーバ「HPE ProLiant Thin Micro TM200」を発表、ProLiant史上最小サイズ
- HPE、小規模システム向けコンパクトサーバ「HPE ProLiant Thin Micro TM200」を発表、ProLiant史上最小サイズ
- Meta、大規模言語モデル「Llama 3.2」を発表
- CloudNative Days Tokyo 2023から、NVIDIA H100を80基使ったKubernetesベースの機械学習プラットフォームを解説
- ハイブリッドカーのモデルを動かす!
- CloudNative Days Tokyo 2023から、WasmのクラウドネイティブやAI推論での利用を解説
- Cloud Native Wasm Dayから大規模言語モデルをWasmで実行するデモを解説するセッションを紹介
- 大規模言語モデルの概要
- AI_dev Europe 2024から生成型AIのオープンさを概観するセッションを紹介