TOP
>
サーバ運用・構築
> Linuxシステムのハードウェア管理と障害監視
改めて知っておきたいRed Hat Enterprise Linux 4 - 管理ツール編
第1回:現実路線のサーバ管理ソフトウェア
著者:
日本ヒューレットパッカード 古賀 政純
2006/11/24
1
2
3
次のページ
Linuxシステムのハードウェア管理と障害監視
大量のサーバが導入されている場合や、サーバのハードウェアやOSの種類が異なるという環境で管理者の工数を低減することは非常に重要です。特にサーバの負荷状態や障害状況、アプリケーションの稼動状況を瞬時に把握したいというニーズは昔から消えることはありません。
シェルスクリプトを使用してシステム情報を収集する手法は、システム導入の際に非常に有用なツールとなります。管理者や導入業者が保守サポート業務を行う場合、工数の削減に役立つことでしょう。しかしこれらのスクリプトを大量のサーバで実行し、ログを収集し、すべてに目を通して異常がないかを管理者がチェックするのは非常に煩雑な作業です。
管理者にとって必要なのは、システムに障害が発生しているか、システムがうまく稼動しているかといった結果だけであり、対象となる数百台ものサーバにログインしてスクリプトを流し、大量の監視項目をチェックする方法は非現実的です。
そこで、複数のサーバを一元管理して自動的にシステム情報を取得し、障害情報をリアルタイムで監視できる手法が必要になります。いわゆる「管理、監視ソフトウェアによる一元管理」と呼ばれるソリューションです。
本連載では、このソリューションを実現し、Linuxシステムのハードウェアの管理や障害監視を行うソフトウェアについて紹介します。
オープンソースのサーバ管理ソフトウェア「Ganglia」
リモートにある大量のサーバ(=管理対象ノード)を一元管理できるオープンソースの管理ソフトウェアとして有名なものの1つに「Ganglia(ガングリア)」があります。Gangliaで一元管理できる主な内容は以下の通りです。
CPU周波数、CPU個数、CPU負荷状況
メモリ容量、メモリ使用量
カーネルバージョン
OSの稼動時間
スワップ容量
ネットワークトラフィック
これらの情報は、時系列のグラフとしてWebブラウザで表示することも可能です。
図1:Gangliaによるブレードサーバの監視
Gangliaを導入して管理サーバを構築するには、Gangliaをインストールしたサーバ上にHTTPサーバも同時に構築しておく必要があります。一方、Gangliaの管理対象となる各ノードには「gmond」と呼ばれるデーモンを動作させておきます。
1
2
3
次のページ
著者プロフィール
日本ヒューレット・パッカード株式会社
古賀 政純
2000年よりUNIXベースのHAクラスタシステム及び、科学技術計算システムのプリセールスに従事。並列計算プログラミング講習会などを実施。その後、大手製造業及び官公庁系の大規模Linuxクラスタの導入、システムインテグレーションを経験。現在は、大規模エンタープライズ環境向けのLinuxブレードサーバ及びHP Serviceguard for Linux(HAクラスタソフトウェア)のプリセールスサポート、システム検証を担当している。毎日、Linuxサーバと寝食を共に(?)しています。
INDEX
第1回:現実路線のサーバ管理ソフトウェア
Linuxシステムのハードウェア管理と障害監視
Gangliaサーバの入手とインストール
gmetadサービスを起動