次世代データセンターネットワークのアーキテクチャー
リソースの結合に必要な技術
以下では、リソース・プールを構築するために必要な技術を掘り下げる。まず第1に、低遅延かつ広帯域であることが重要であり、このうえで信頼性の確保も求められる。特に、メモリをリソース・プール化する場合は、性能に関してシビアになる。
低遅延はどのようなネットワークでも求められるが、メモリのリソース・プールを構築するとなると、遅延時間は100ナノ秒(0.1マイクロ秒)程度でなければならない。このクラスのネットワークを構築可能なネットワーク技術となると、現時点ではInfiniBandくらいである。
現在普通に使われている10Gbit Ethernet(10GbE)を使う限り、米Brocade Communications Systems(Brocade)の製品や米Arista NetworksのASIC(特定用途向けIC)技術でも、サブマイクロ秒程度の遅延が発生する。このため、Ethernet技術を使うのであれば、もう少し技術が進歩する必要がある。
一方、帯域という側面では、Ethernetの10Gビット/秒(およそ1Gバイト/秒)という帯域幅は、やや狭いと言わざるを得ない。米IntelのNehalemアーキテクチャーのプロセッサ間インターコネクト技術であるQPI(QuickPath Interconnect)は、25Gバイト/秒の帯域幅を持つからである。この差は大きく、メモリの利用形態によっては顕在化する。
メモリ共有型アプリケーションだけでなく、例えば、仮想サーバーのマイグレーションを実行するアプリケーションや、マルチノード・クラスタ環境でチェック・ポイント処理を実行するアプリケーションなどで、ノード間の帯域幅が問題になる。これらのアプリケーションでは、メモリ空間をディスクやほかのノードに書き出す処理を行うからである。
ただし、EthernetにせよFibre Channel(FC)にせよ、複数回線を束ねるリンク・アグリゲーションやトランキングなどを使えば帯域を拡大できる。特に、BrocadeのBrocade ISL TrunkingやPCI-Expressのマルチレーン通信では、複数のリンクにフレーム単位で分散する機能やバイト・ストライピングと呼ぶ技術により、より効率よく複数のリンクを使用できる。
多くのデータセンターではレイヤー2ネットワークにSTP(スパニング・ツリー・プロトコル)を使用しているため、ブロッキング・ポートによって同一構成では帯域が狭いという弱点がある。Fibre ChannelではFSPH(Fabric Shortest Path First)と呼ぶ技術によって解決しているが、Ethernetでは標準化が待たれている。
ロスレス性(信頼性)の確保やオフロード処理が重要
低遅延/広帯域に加えて、リソース・エリア・ネットワークではロスレス(Lossless)性が求められる。
そもそも低遅延性が求められるため、プロトコル・レベルでのエラー・リカバリはオーバー・ヘッドが大きすぎる。したがって、バッファ・オーバー・フローしないようなフロー制御が必要になる。現在ではFibre Channel(FC)や、Converged Enhanced Ethernet(CEE)やCisco Data Center Ethernetなどの次世代Ethernet技術によって、このようなフロー制御が実現されている。
もう1つリソース・エリア・ネットワークで必要になる技術が、別のハードウエアを用いた処理のオフロードである。メモリ通信やI/O通信は、その低遅延性からCPU処理すると高価についてしまうため、別のハードウエアで処理をオフロードすることが重要である。これはまさに、メインフレームにおける「チャネル」そのものである。
オフロードする機能はプロトコル処理だけではない。もっとも重要なのは「ファブリック・インテリジェント・サービス」である。これは、リソースの動的追加や経路の動的な変更に必須となる機能である。TCP/IPでこうしたサービスを構成することはできない。なぜなら、I/Oやメモリ通信はOS起動前に構成されていなければならないからである。
なお、データセンター・ネットワークを支えるネットワーク機器は、性能だけでなく消費電力も重要である。例えば、「Brocade NetIron MLX」(10Gビット/秒あたり81.1ワット)や「Brocade DCX backbone director」(1Gビット/秒あたり0.44ワット)は、他ベンダーの同等構成より50%から1000%ほど効率がよい。
次ページでは、リソース・エリア・ネットワークを広域へと拡張するための技術を解説する。