広域ファイル共有の性能評価と事例

2009年1月28日(水)
建部 修見

T2Kオープンスパコンにおけるファイル共有

 これから、いくつかの利用事例について紹介します。

 筑波大学、東京大学、京都大学の三大学は2008年のスーパーコンピュータの調達、運用、研究などを協力して行うT2Kオープンスーパーコンピュータアライアンス(http://www.open-supercomputer.org)を組みました。三大学のスーパーコンピュータを連携させるため、グリッド技術を用いたシングルサインオンによるログイン、ファイル共有が行われています。このファイル共有には、Gfarm広域ファイルシステムが用いられています。

 これにより、三大学間でファイル転送を明示的に行うことなく、どこのスパコンからでも同一のファイルシステムへのアクセスが可能となりました。これにより、利用状況に応じてどのスパコンでも同じように利用することができます。まずは、ファイル共有により三大学のスパコン利用の垣根が少し崩れました。

 シングルサインオンによるログイン、ファイル共有はGSIを用いていますので、利用するためには筑波大学CCS 認証局(http://www.ccs.tsukuba.ac.jp/ca/)あるいは東京大学ITC認証局でユーザー証明書を取得する必要があります。筑波大学CCS認証局では、スパコンのアカウント所有者に対し、Webページで数クリックするだけで自動的に証明書が発行されるようになっていますので、取得は簡単です。

情報爆発InTriggerによる分散データ処理

 文部科学省科学研究費補助金特定領域研究「情報爆発時代に向けた新しいIT基盤技術の研究(情報爆発IT基盤)」(http://www.infoplosion.nii.ac.jp/info-plosion/)では、研究推進のためInTriggerプラットホームを構築しています。InTriggerは毎年増強されますが、原稿執筆時点(2009年1月現在)、はこだて未来大学から九州大学までの14拠点、423ノード(1,282CPUコア)で構成されています。

 Gfarm広域ファイルシステムはこのような大規模計算機環境においても利用されています。2009年1月20日、21日に開催された成果発表会では、そのときファイルシステムノードとして利用可能であった239ノードを利用した147TByteの広域ファイルシステムのデモンストレーションが行われました。

 どの拠点の計算ノードからでもマウントしてファイル共有ができるデモンストレーションをはじめ、クライアントとして利用可能な247ノードで一斉にマウント、一斉に読み書きベンチマークの起動、すばる望遠鏡の実データを用いた複数拠点による分散超新星探索のデモンストレーションが行われました。

 このように、単なるファイル共有だけではなく、広域分散データ解析のためのファイルシステムとしても利用されています。

 本連載はこれで終わりですが、Gfarm広域ファイルシステムはSourceForge (http://sf.net/projects/gfarm/)でオープンソース開発が進められています。お気軽に最新のコードを利用、また開発へ参加してみてください。最新のコードは以下のコマンドで取得できます。

% svn co https://gfarm.svn.sourceforge.net/svnroot/gfarm/gfarm_v2/trunk gfarm_v2
% svn co https://gfarm.svn.sourceforge.net/svnroot/gfarm/gfarm2fs/trunk gfarm2fs

 取得後、まずgfarm_v2ディレクトリに移動して、configure &&make && make installでコンパイルとインストールを行います。必要があればconfigureのオプションの--prefixでインストールディレクトリを指定します。configureのオプションの詳細はGfarmドキュメントのソースコードからインストールを参照してください。

 次にgfarm2fsディレクトリに移動し、configure && make &&make installでコンパイルとインストールを行います。Gfarmのライブラリが見つからない場合はconfigureのオプションの--with-gfarmでGfarmのインストールディレクトリを指定します。

 GfarmのWebページ(http://datafarm.apgrid.org/)では、リリースアナウンス用および議論の場としてのメーリングリストも準備していますのでぜひご参加ください。


【参考文献】

「Gfarm Datafarm - Gfarm file system」(http://datafarm.apgrid.org/)(アクセス:2009/01)

筑波大学
東京大学理学部情報科学科を卒業後、同大学大学院で博士(理学)を取得。電子技術総合研究所を経て、現在は筑波大学准教授。超高速計算システム、グリッドコンピューティング、並列分散システムソフトウエアの研究に従事。Gfarm広域ファイルシステムの開発を主導している。http://sourceforge.net/projects/gfarm/

Think ITメルマガ会員登録受付中

Think ITでは、技術情報が詰まったメールマガジン「Think IT Weekly」の配信サービスを提供しています。メルマガ会員登録を済ませれば、メルマガだけでなく、さまざまな限定特典を入手できるようになります。

Think ITメルマガ会員のサービス内容を見る

他にもこの記事が読まれています