JBoss Data Gridの構成とチューニングポイント
JVMレベルのチューニング:ガベージコレクションの制御
JDGはJVMのガベージコレクション(GC)による影響を極小化しなければなりません。一般にGCはJavaヒープ領域がスワップされてしまうと極端にGCポーズ時間が長くなる傾向があります。そのためJVMオプションには、-XX:+UseLargePagesオプションを設定することをお勧めします。
UseLargePagesのメリットは2つあります。1つは、ページサイズを大きくすることで、ページメモリ取得のオーバーヘッドを小さくすること、もう1つは、ヒープメモリをスワップさせず、物理メモリに固定化することにより、GCのポーズ時間が長期化するのを防ぐ効果があることです。なお、UseLargePagesオプションはOSレベルでの設定も必要である点に注意してください(Linuxの場合は、明示的なHuge Page設定が必要です)。
JDGサーバーに好ましいGCアルゴリズムとしては、JVMデフォルトのパラレルGC (-XX:+ UseParallelOldGC、および -XX:+ UseParNewGC)、CMS (-XX:+ UseConcMarkSweepGC)のどちらかを使用します。32コア以上のCPUであれば、パラレルGCのポーズ時間はとても小さいですし、ヒープに十分余裕があれば、フルGCの発生タイミングを低トラフィックの時間帯で行うように制御することも可能です。また、CMSを選択すれば、GC発生回数は多くなりますが、フルGCを避けて1回あたりのGCポーズ時間を短くする効果が得られます。どちらが適切かは一概には言えないため、アプリケーションの性能要件に応じて、それぞれのGCアルゴリズムを評価し、適切な方を選択してください。
Infinispanレベルのチューニング:同期と非同期の選択
JDGクラスタでは、キャッシュエントリの追加または更新の動作は、1)ローカルコピーの更新、2)レプリケーション処理(他ノードへのバックアップ用データの更新)の2つのステップから構成されています。このうち、後者のレプリケーション処理は、クライアントからのリクエストに含めて同期的に行うか、バックグラウンド処理として非同期的に行うかを設定で選ぶことができます。
レプリケーションを非同期にすれば、その分だけクライアントに早く応答を返すことができるため、応答性能は向上します。しかし、その一方で、非同期レプリケーション用のキューに待機中のリクエストのデータは、そのノードがクラッシュしたときに失われてしまうため、信頼性が低下することになります。
同様に、キャッシュにストアを設定する場合、ストアへの書き込み処理は通常同期的ですが、非同期書き込みとして設定することができます(図3参照)。
同期・非同期の選択は、信頼性・性能のトレードオフに直結する判断になりますので、JDGで扱うデータのシステム要件に応じて慎重に選択する必要があります。
JGroupsレベルのチューニング:TCPとUDPの選択
JDGのトランスポートとして使用されているJGroupsでは、ノード間のメッセージ送受信をTCPベースとするか、UDPベースとするかを選択することができます。どちらを選んでもJDGとしての基本的な動作には影響しません。
JDGサーバーのデフォルトのプロトコルはUDPになっていますが、UDPはクラスタのノード数が8以上であったり、キャッシュモードがReplicationモードである場合に有効な方式です。一般的にはデフォルトのUDPで十分ですが、それ以外の場合はTCPを選択することも検討します。特に、DistributionモードではJDGノードをクラスタに追加するときのディスカバリプロトコルでしかUDPマルチキャストを使用せず、ほとんどのメッセージがpoint-to-pointメッセージで済むため、TCPの方が性能がよい場合があります。
以上、JDGのアーキテクチャとチューニングポイントについて、基本的な事項をピックアップしてご紹介いたしました。JDGのチューニングは意外と奥が深いので、より詳細な情報は別の機会にお伝えできればと思います。
次回、第8回はJBoss Data Gridの高度な機能ついて解説したいと思います。ご期待ください。