スイッチの帯域を高めるEthernet Fabric
スイッチ「Brocade VDX6720シリーズ」
第1回で説明した通り、米Brocade Communications Systems(以下、Brocade)は2010年11月、「Brocade VDX6720」というデータセンター・スイッチ製品群を販売開始した。この製品は、データセンターにおいて、高スループット化、高密度化、運用管理のシンプル化に向けた、各種の機能を搭載している。このうち、今回の第2回では、高スループット化を実現する機能について解説する。
高スループット化が必要な背景
サーバー仮想化によってサーバーの高密度化を検討する場合、そもそもサーバー仮想化の導入以前にトラフィックの密度が高まっている状態である。通常のIPパケットに加えて、ストレージ接続やクラスタ内インターコネクトなどのトラフィックも重なる。ここにサーバー仮想化を使用すると、仮想マシンのライブ・マイグレーションなどに応じて、メモリー間コピーのトラフィックなども乗ってくる。
したがって、LANが現状で使っているトラフィックの、およそ4倍から10倍のトラフィック流量に耐えられるような仕組みが必要になる。こうしたネットワークを、普通の10Gbps Ethernetだけで構築できないのだろうか。
既存のEthernetには、スループットを伸ばしにくいという弱点がある。この弱点は、Ethernetの仕組みに由来する。つまり、「スイッチは、寿命のないEthernetフレームを、単に転送するだけ」という仕組みが原因である。この仕組みの下では、ループが存在するトポロジにおいて、ブロードキャスト・ストームを引き起こす。このため、ループを形成しないトポロジを構成するか、あるいはSpanning Tree Protocol(STP)を使って、ループを構成しないようにブロック・ポートを構成するしかない。
STPの問題点は、ここである。ブロック・ポートを構成するしかないため、物理的に複数の等価コストのパスが存在したとしても、たった1つのパスしか使用できない、ということである。
もちろん、この制限に対する解決策も考案された。Multiple STPである。Multiple STPでは、VLAN単位にSpanning Treeを構成することで、データセンター全体でのスループットの低下を抑える。しかし、単一のSpanning Tree単位で見ると、通常のSTPと同様に、ループ構成は許容されない。
図1: Ethernetの特徴、ループが引き起こす問題(クリックで拡大) |
Ethernet Fabric技術の仕組み ~等価コスト・マルチパス技術~
Brocadeは、STPが抱えるこの問題を、IETFの「Transparent Interconnect of Lots of Links」(TRILL)と呼ぶ技術を使って回避している。TRILL自体の説明は、2010年2月に掲載した連載の第4回でもしているので、今回はより詳細に解説する。
TRILLに根拠を置く機能が、Brocade VDX6720のVirtual Cluster Switching(VCS)である。VCSは、4つの柱で構成する。このうちの1つがEthernet Fabricである。Ethernet Fabricは、以下の手順でファブリックを形成する。
- ポート初期化
- インタフェースの起動と、対向ポートとの間のキャラクタ同期
- Brocade Fabric Link Discovery Protocolによる、隣接スイッチの発見
- ファブリック・パラメータの交換
- ファブリック形成
- Principal RBridgeの選出
- Trunkリンクの形成
- リンク・ステートDBの構成
- パス選択