「PyTorch 2.12.1」リリース ─ 量子化テンソルの範囲外読み取り問題などを修正

2.12.0の回帰、vLLMやBlackwell GPU関連の不具合にも対応

6月18日 23:29

　PyTorch Foundationは6月17日（現地時間）、機械学習フレームワーク「PyTorch 2.12.1」をリリースした。

　「PyTorch」は、Python向けのオープンソース機械学習フレームワーク。深層学習モデルの研究開発から本番環境での学習・推論などに利用されている。

　「PyTorch 2.12.1」は、PyTorch 2.12系のポイントリリース。「PyTorch 2.12.0」で生じた回帰、正確性、後方互換性、クラッシュ、メモリ処理などに関する不具合が修正されている。

　「PyTorch 2.12.1」のハイライトは次の通り。
〇量子化テンソルの復元時にstrideの範囲検証が不足していた問題を修正
〇悪意のあるデータの読み込み後に範囲外メモリの読み取りやプロセスクラッシュが発生する可能性のある問題に対応
〇vLLMのDeepSeek-V3.2向けカスタムオペレータがtorch.compileのaliasing検証でエラーになる問題を修正
〇NVIDIA B100/B200 GPUでTriton生成の畳み込み逆伝播カーネルが不正なメモリアクセスを起こす問題を修正
〇PyTorch 2.12.0で発生した回帰や後方互換性に関する不具合を修正
〇リリース用バイナリやビルド、テスト関連の修正を反映
など。

　量子化テンソルに関する問題では、`torch.load()`を`weights_only=True`で使用してデータを読み込んだ場合でも、量子化テンソルのstrideがストレージの範囲内に収まっているかの検証が十分でなかったため、細工されたデータを読み込んだ後に`dequantize()`などの処理を実行すると、プロセスメモリの範囲外読み取りやクラッシュにつながる危険があった。

　また、vLLMとの互換性に関しては、DeepSeek-V3.2のsparse attentionで利用されるカスタムオペレータが入力テンソルと出力テンソルを共有していたため、PyTorch 2.12で強化されたaliasing検証によってエラーとなる問題が修正された。

　NVIDIA Blackwell世代のB100/B200 GPUでは、Tritonが生成する畳み込み処理の逆伝播カーネルで、範囲外のメモリ読み取りによるCUDAエラーが発生する問題にも対応している。

　「PyTorch 2.12.1」は、Webサイトから入手できる。

(川原龍人/びぎねっと)

[関連リンク]
リリースアナウンス
PyTorch 2.12.1

この記事をシェアしてください