Xeon E7 v3のアーキテクチャ（前）

連載 :

2015年5月28日(木)

米インテル社は、2015年5月5日（現地時間）に、Xeonシリーズの最上位となるXeon E7にHaswellマイクロアーキテクチャを採用したXeon E7 v3シリーズを発表しました。同シリーズは、最上位でクロック周波数2.5GHz、18コア、ラストレベルキャッシュ（LLC）45MBのXeon E7-8890v3からクロック周波数2GHz、8コア、LLC 20MBのE7-4809v3までの12種のバリエーションがあり、基本的なサーバーから基幹システム、HPC（High Performance Computing。主に科学技術計算などに利用）向けまでをカバーします。

図1：Xeon E7v3プロセッサ①

図2：Xeon E7v3プロセッサ②　ソケットR1（LGA2011）を採用

Xeon E7 v3の概要

Xeon E7 v3は、大企業向け、ミッションクリティカル業務向けで、標準的な基幹サーバー、データベースやこれを使う高度なビジネス分析業務、仮想化による統合などを想定しています。

インテルによれば、10年前のXeon MP（4コア）と比較してXeon E7-8890v3は40倍以上の性能差があり、ラック数台を必要としていた処理を3U程度のサイズにまで縮小できるといいます。これにより、多数のラックを集約できるとともに、より高度な処理も可能になるといいます。

Xeonシリーズでは、すでにXeon E5系列がv3となってHaswellマイクロアーキテクチャ（メインストリームサーバー向けのHaswell-EPコア）に切り替わっていますが、E7v3では、ミッションクリティカル向けのアドバンスドRAS機能などが搭載されたHaswell-EXコアが使われています。

なお、インテルのクライアント向けCPUでは、Haswellを使うのは、第4世代Coreプロセッサとなっていますが、Xeon系では、SandyBridge（クライアント向けでは第三世代Core）相当のものがv1となったため、クライアント向けとは世代を表す数字がずれています。というのも、クライアント向けの第2世代CoreプロセッサとなったWestmere世代で、Xeonは現在のE3/5/7という番号体系が最初に採用され、この時点ではvの付かない型番が使われていたからです。そもそも、高度なRAS技術などを導入し、大量のキャッシュメモリを搭載するなど、クライアント向けに比べると、さらに設計時間が必要なXeon系プロセッサをクライアントと同じタイミングで出荷するのは難しく、ターゲットとなる基幹サーバーなども置き換え周期が数年となるからです。

E7 v2 vs. E7 v3

また、前世代のXeon E7 v2では、IvyBridgeベースのIvyBridge-EXコアが採用されていました。まずは、前世代との比較しながら、Xeon E7 v3を見ていきます。そもそもIvyBridgeとHaswellは、製造プロセスが同じ22ナノメートルですが、Haswellではマイクロアーキテクチャの改良が行われ、それにより性能値が向上しています。

ハードウェア面での大きな違いは、最大コア数が18（v2では15）になったことです。これにともない最大LLCサイズが45MB（v2では37.5MB）に増えていますが、コア1つあたりのLLCは2.5MBで変わっていません。また、DDR4、DDR3の2タイプのメモリをサポートしています（v2ではDDR4のサポートなし）。接続できるDIMMスロット数は最大24（3DIMM/チャンネル）で数としては変わりませんが、最大メモリ転送速度は1600MT/s（メモリトランザクション毎秒）が利用可能になっています（DDR3/DDR4の両方で可能）。周辺回路との接続を行うQPIは、Ver.1.1、1パッケージ3チャンネルのままですが、最大転送速度が9.6GT/s（ギガトランザクション毎秒。v2では8GT/s）と上がっています。また、QPIのチャネル数が同じであるため、マルチプロセッサ（マルチソケット）の基本的な構成方法も前世代と同一となります。統合されたI/OやPCI Expressのレーン数やバージョンなどには変化がなく、同じSocket R1（LGA2011）を利用します。ただし、TDP（Thermal Design Power。設計時に想定すべき発熱量）は最大165Wとなり、v2の155Wに比べて10W上がっています。

命令セットの拡張

内部的には、AVX2命令セットに対応しました。IvyBridgeではAVX1命令セットまでのサポートで、それに比べると浮動小数点演算の性能が倍程度に向上しています。また、RAS機能が強化されており、Enhanced Machine Check Architecture（eMCA）が第2世代となり、DDR4メモリのエラーリカバリ機能の装備や、すべてのエラーをファームウェア側で先に処理するFirmware First Model（FFM）が装備されました（後述）。そのほかの機能としては、TSXがあります。TSXは、先にクライアント向けCPUで導入されましたが、動作に問題があったために現在では無効にされていた機能です。このXeon E7v3では、有効化され、利用できるようになりました。なお、クライアント向けの第5世代Coreプロセッサで採用されているBroadwellでも、TSXは有効化されいません。ただし、Xeon系で最初にTSXを有効化したのは、先に発表されたXeon-D系列です。

E7v2とE7v3は、ハードウェア面では同一の部分を残しつつ、内部的な強化が行われており、E7v2用のマザーボード設計をE7v3用に流用できます。これは、あくまでもハードウェアベンダー側の設計を容易にするためのもので、エンドユーザー側でCPUを差し替えて動作するというものではありません（いくつかの機能強化のためファームウェアが同一にならない）。

Xeon E5 v3 vs. Xeon E7 v3

次に、先にv3となったXeon E5v3と比較してみましょう。そもそもE5とE7では、システム規模やターゲットが違っています。このため、サードパーティのノードコントローラーを利用しない場合、E5v3は2ソケット、E7v3は4または8ソケットという違いがあります。また、メモリ関係では、E7v3がDDR3/DDR4両対応（E5v3はDDR4のみ対応）となり、最大メモリ搭載量も6TB（64GBDDR4 DIMM利用時）となり、1.5TBのE5v3と大きく異なります。これはソケット数とメモリスロット数の違い（E7v3は96、E5v3は24）によるものです。また、DDR3にも対応できたのは、プロセッサ外部にスケーラブルメモリバッファIntel C112/C114を置く構成だからです。このC112/114がDDR3、DDR4に対応しています。C112と114の違いは、チャンネルあたりのDIMM数でC112が2DIMM/チャネル、C114が3DIMM/チャンネルとなります。

なお、E7v2との比較で挙げた第二世代eMCAについては、E5v3にも搭載されているものの、E7v3では機能強化が行われています。