OSSで実現する HPC on SoftLayer
[PR]
HPC(High Performance Computing)環境をOSSとSoftLayerで構成する際のデザインと実装のTipsと、応用例としてOSSの流体解析ツールの実装について説明します。
HPCとは
HPC(High Performance Computing)は、大規模な並列計算を必要とする分野です。この分野で採用されているシステムがいわゆる「スパコン」です。かつては各メーカー独自の実装が多かったこの分野では、現在x86サーバーを高速ネットワークで複数台並べる「クラスタシステム」が主流です。OSもほぼLinuxで稼働しており、まさにOSSの一応用例になっています。
クラウドサービス(特にIaaS)でも、この1〜2年は最新CPUの採用や実装技術の向上によって、性能が「ゆらがない」サービスが利用できるようになり、HPC分野でもクラウドで十分に利用に耐えうる環境が整いつつあります。
HPCシステムに必要なハードウェアとSoftLayer
前述の「クラスタシステム」は、大規模並列計算に耐えうるコンポーネントで構成する必要があります。特に、高い演算能力を維持するために下記デバイスの有無が重要です。
- 最新CPUと大容量メモリの占有(ベアメタルインスタンス)
- 高速ネットワーク(1G、10Gbps)
- InfiniBand(HPC向けインターコネクト)
- GPGPUデバイス(nVIDIA K20等)
- 高速なローカルI/Oデバイス(SSD、Fusion-IO等)
- 並列共有ファイルシステム(Elastic Storage)
- 高速かつセキュアなファイル転送(Aspera)
データセンターにもよりますが、上記のコンポーネントがほぼすべて手に入るSoftLayerは、HPC環境のクラウド運用に十分耐えうると判断できます。特にこれらのデバイスを自由に選択できるベアメタルインスタンスは、まさにHPC向けのIaaSとしては最も優れた環境といえるでしょう。ただし、ベアメタルインスタンスを利用する場合、データセンターによってはサーチャージ(利用料金とは別に課金される手数料)がかかります。サーチャージについてはデバイスのオーダー時にポータルに表示されるので、注意して選択してください(図1)。
HPCクラスタシステムのデザインパターン
HPCクラスタシステムは、その実装の大小はありますが、デザインはほぼ「一択」といっても過言ではないでしょう。そのデザインを図2に示し、各要素を説明します。
- ヘッドノード
ユーザーがログインし、ジョブスケジューラなどで、計算ノードにジョブを投入やコンパイルなどの事前処理を行うノードです。基本的にユーザーは、このノードのみ対話式にアクセスをします。ヘッドノードは、CPUに大きな負担をかける計算は基本的に行わないので、コストメリットの高い仮想インスタンスを選択してもよいでしょう。 - 計算ノード
実際の計算資源としてアサインされ、ユーザーの計算を行います。計算ノードは高性能かつ高スループットが必須となるため、高い性能を維持するために、ベアメタルインスタンスを採用することをおすすめします。高速インターコネクトであるInfiniBandやGPU、SSD等のHPC向けデバイスを自由に構成できる利点を、最大限に活用できます。 - ファイルサーバー
home領域としては、NASを採用しても問題ありません。ただし、多数の計算ノードが同時にI/Oを行うアプリケーションを実行する場合は、別途Elastic Storage等の並列ファイルシステムの採用も必要です。 - ネットワーク
内部LANは10Gbpsを採用しましょう。追加で管理用ネットワークを追加してもよいでしょう。おおむね8台以上の計算ノードを、ベアメタルインスタンスを利用する場合はInfiniBandを構成し高スループットを確保することで、並列計算性能の劣化を防止できます。
連載バックナンバー
Think ITメルマガ会員登録受付中
全文検索エンジンによるおすすめ記事
- SoftLayerでDocker環境を整えるコツ
- OpenStack Juno on SoftLayer by RDO
- クラスキャット、OpenStack Kiloベースのプライベートクラウドソリューションを提供開始
- ZabbixでSoftLayerを監視してみよう!
- ベアメタルの今を語り尽くすイベント「第1回OCDETベアメタルWG勉強会」レポート
- ownCloudで実現するセキュアな無制限ストレージ on Softlayer
- ベアメタル事業者が語るAWSとの違い―ベアメタル座談会レポート
- クラスキャット、OpenStackプラットフォームをサービスとして利用可能な新マネージドサービス提供
- AWS、「Amazon EC2」に18TiBおよび24TiBサイズのメモリを追加
- HPCシステムズ、「富岳」と同じA64FXを搭載したスーパーコンピュータをキャンペーン価格で提供