広域ファイル共有の性能評価と事例
Gfarmファイルシステムによる広域ファイル共有
前回までの解説でGfarm広域ファイルシステムがマウントできるようになりました。Gfarm広域ファイルシステムはどこからでもマウントできますので、これで広域におけるファイル共有が可能となります。
NFSなどの集中型のファイルサーバーでも、遠隔からマウントすることにより機能的には同様のファイル共有ができそうですが、応答性、アクセス性能、耐故障性、セキュリティーに差があります。
Gfarmファイルシステムでは、ファイルシステムノード自体を分散配置できますので、近くのファイルを参照することで応答性、アクセス性能をあげることができます。耐故障性も、ファイル複製を複数持つことで自動的に満たされます。セキュリティーは、広域環境でアクセスすることを想定して、GSIをサポートしています。
JLDGの環境を例にとり、これから広域におけるファイル共有に関して性能をみていきましょう。JLDGは執筆現在、筑波大学、高エネルギー加速器研究機構(KEK)、京都大学、大阪大学、金沢大学、広島大学で構成されています。メタデータサーバーノードは筑波大学のノードが利用されています。
地理的に遠い、筑波大学と広島大学でGfarmファイルシステムをアクセスしたときの応答性能、アクセス性能をみていくことにします。
Gfarmファイルシステムの応答性能
筑波大学のクライアントでJLDGのGfarm広域ファイルシステムをマウントします。それぞれの操作にかかる時間を伝えるため、図1のように/usr/bin/timeコマンドで時間を計っています。/usr/bin/timeは実行したコマンドのユーザーモード、カーネルモードでのCPU実行時間、経過時間、CPU使用率、メモリ使用量、入出力回数、ページフォールト回数、スワップ回数を表示するコマンドです。
gfarm2fsコマンドによるGfarmファイルシステムのマウントは、0.01秒でした。gfdfコマンドによるファイルシステムノードの状態表示により、利用可能なファイルシステムノードは筑波大学(jldg-fs1-sc, jldg-fs0-sc)、KEK(scjldgkek01)、大阪大学(rcnp-gf-ss)、広島大学(jldghu01)であり、総容量は24TByteであることが分かります。所要時間は0.01秒でした。dfコマンドの所要時間は0.01秒にも満たない位でした。