改めて知っておきたいRed Hat Enterprise Linux 4 - 管理ツール編 1

現実路線のサーバ管理ソフトウェア

Linuxシステムのハードウェア管理と障害監視大量のサーバが導入されている場合や、サーバのハードウェアやOSの種類が異なるという環境で管理者の工数を低減することは非常に重要です。特に サーバの負荷状態や障害状況、アプリケーションの稼動状況を瞬時に把握したいというニーズは昔から消えることはありません

古賀 政純

2006年11月24日 20:00

Linuxシステムのハードウェア管理と障害監視

大量のサーバが導入されている場合や、サーバのハードウェアやOSの種類が異なるという環境で管理者の工数を低減することは非常に重要です。特に サーバの負荷状態や障害状況、アプリケーションの稼動状況を瞬時に把握したいというニーズは昔から消えることはありません。

シェルスクリプトを使用してシステム情報を収集する手法は、システム導入の際に非常に有用なツールとなります。管理者や導入業者が保守サポート業務 を行う場合、工数の削減に役立つことでしょう。しかしこれらのスクリプトを大量のサーバで実行し、ログを収集し、すべてに目を通して異常がないかを管理者 がチェックするのは非常に煩雑な作業です。

管理者にとって必要なのは、システムに障害が発生しているか、システムがうまく稼動しているかといった結果だけであり、対象となる数百台ものサーバにログインしてスクリプトを流し、大量の監視項目をチェックする方法は非現実的です。

そこで、複数のサーバを一元管理して自動的にシステム情報を取得し、障害情報をリアルタイムで監視できる手法が必要になります。いわゆる「管理、監視ソフトウェアによる一元管理」と呼ばれるソリューションです。

本連載では、このソリューションを実現し、Linuxシステムのハードウェアの管理や障害監視を行うソフトウェアについて紹介します。

オープンソースのサーバ管理ソフトウェア「Ganglia」

リモートにある大量のサーバ(=管理対象ノード)を一元管理できるオープンソースの管理ソフトウェアとして有名なものの1つに「Ganglia(ガングリア)」があります。Gangliaで一元管理できる主な内容は以下の通りです。

  • CPU周波数、CPU個数、CPU負荷状況
  • メモリ容量、メモリ使用量
  • カーネルバージョン
  • OSの稼動時間
  • スワップ容量
  • ネットワークトラフィック

これらの情報は、時系列のグラフとしてWebブラウザで表示することも可能です。

Gangliaによるブレードサーバの監視
図1:Gangliaによるブレードサーバの監視

Gangliaを導入して管理サーバを構築するには、Gangliaをインストールしたサーバ上にHTTPサーバも同時に構築しておく必要があります。一方、Gangliaの管理対象となる各ノードには「gmond」と呼ばれるデーモンを動作させておきます。

 

この記事をシェアしてください

人気記事トップ10

人気記事ランキングをもっと見る