TOPキーパーソンインタビュー> Stratus Special Interview
「信頼性」「可用性」を具現化する無停止型IAサーバ「ftServer」
前のページ  1  2   3  次のページ

— こうした特殊な構造では、運用管理負担が大きくなるのではありませんか
松崎氏 松崎氏: 確かに特殊なハードウェア設計となっていますが、ユーザやOSから見た場合にはシングルシステムを使用するのと同様に取り扱うことができます。このため、ftServerの特殊性による運用管理負担の増加はありません。

むしろ通常のクラスタシステムなどと比べて極めて容易な管理方法で高信頼性システムの構築が可能ですし、オペレーションミスといった人的災害も発生しづらくすることができます。

ftServerのサポートOSは、Microsoft Windows 2003 Server、Red Hat Enterprise Linux、MIRACLE LINUXの3つですが、これらはftServer向けの特別仕様のものではありません。一般的に流通しているこれらのOSがそのまま使えます。

二重化されているハードウェアとOSの間には弊社が提供するドライバソフトウェアが動作していますが、このソフトウェアによって二重化されているハードウェアを1つに見せています。

例えば、CPU、チップセットやメモリなどは、実際には2つ実装されていますが、OSには1つとして認識されます。

実際の動作ですが、正常時は実装されている2つのコンポーネントで同時に同じ処理を行っています。障害が発生した場合には障害部品が自動的にシステムから切り離されますが、両系で同時に同じ処理を行っているため、性能劣化もなく何事もなかったかのようにシステムは稼動し続けます。これはストラタステクノロジーの「ロックステップ」技術によるものです。

I/Oの部分については実装分すべてが認識され、ドライバレベルでフェイルオーバの二重化を行っています。ネットワークについてはコントローラの二重化を行い、アクティブスタンバイ(ホットスタンバイ)として待機しており、障害発生時には一瞬で切り替わります。

ftServerがシングルシステムとして動作する仕組み
図2:ftServerがシングルシステムとして動作する仕組み

このような構成によって、システムやアプリケーションのインストールにおいても一般的なサーバとまったく同じシングルシステムとして扱うことができるのです。


— 仮に障害が発生した場合のパーツ交換が面倒なのではありませんか
望月氏 望月氏: ftServerを構成する各パーツはコンポーネント化されており、障害が発生したとしても迅速に交換を行えるようになっています。さらにftServerは、ハイエンドモデルからローエンドモデルまで同様に、弊社によるリモート保守を提供しています。

前述のようにftServerは障害が発生した場合には、自動的に切替が行われて障害部分を自動的に切り離します。この時、システムは正常なユニットで連続稼働を続けています。

一方、障害発生と同時に弊社の保守センターに通知があり、お客様への通知と障害ユニットの交換手続きを開始します。この場合にも基本的にサーバの停止は必要なく、ユニット交換後は再び二重化による稼働に戻るようになっています。

ftServerのリモート保守の仕組み
図3:ftServerのリモート保守の仕組み
(画像をクリックすると別ウィンドウに拡大図を表示します)

これは管理負担や運用コストに密接に関連するものであり、弊社製品を導入いただいた企業から高い評価をいただいております。


— それでは「ftServerは100%停止しない」と考えてよいのでしょうか。
望月氏: 弊社では、ファイブナイン(99.999%)以上の稼働率(注1)を実現しています。弊社サイトのトップページでは、現在提供しているサーバの稼働状態を表示しており、リアルタイムに稼働率を確認できます。

※注1: ここでいう「稼働率」とは「稼働しているftServerの台数」ではなく、「システム稼働時間に対する実稼働時間の割合」を意味します。詳しくは以下のURLを参照してください。
http://www.stratus.co.jp/uptime/

基本的にリモート保守を行っているため稼働率を100%に近づけることはできますが、2つの理由によって残念ながら達成に至っていません。

まず1つは、お客様の中にリモート保守を採用されていないケースがあることです。片方のユニットに障害が発生してもリモート保守を行っていないため、お客様の側で1ユニットで動作していることに気づかれない場合があります。このようなケースでは、残った1ユニットに障害が発生して停止するまで、対策が取れないことがあるのです。

またハードウェア的には稼動を続けられる状態でも、導入したソフトウェアの障害によってシステムダウンが引き起こされるケースもあります。


前のページ  1  2   3  次のページ