|
||||||||||
| 1 2 3 次のページ | ||||||||||
| Linuxシステムのハードウェア管理と障害監視 | ||||||||||
|
大量のサーバが導入されている場合や、サーバのハードウェアやOSの種類が異なるという環境で管理者の工数を低減することは非常に重要です。特にサーバの負荷状態や障害状況、アプリケーションの稼動状況を瞬時に把握したいというニーズは昔から消えることはありません。 シェルスクリプトを使用してシステム情報を収集する手法は、システム導入の際に非常に有用なツールとなります。管理者や導入業者が保守サポート業務を行う場合、工数の削減に役立つことでしょう。しかしこれらのスクリプトを大量のサーバで実行し、ログを収集し、すべてに目を通して異常がないかを管理者がチェックするのは非常に煩雑な作業です。 管理者にとって必要なのは、システムに障害が発生しているか、システムがうまく稼動しているかといった結果だけであり、対象となる数百台ものサーバにログインしてスクリプトを流し、大量の監視項目をチェックする方法は非現実的です。 そこで、複数のサーバを一元管理して自動的にシステム情報を取得し、障害情報をリアルタイムで監視できる手法が必要になります。いわゆる「管理、監視ソフトウェアによる一元管理」と呼ばれるソリューションです。 本連載では、このソリューションを実現し、Linuxシステムのハードウェアの管理や障害監視を行うソフトウェアについて紹介します。 |
||||||||||
| オープンソースのサーバ管理ソフトウェア「Ganglia」 | ||||||||||
|
リモートにある大量のサーバ(=管理対象ノード)を一元管理できるオープンソースの管理ソフトウェアとして有名なものの1つに「Ganglia(ガングリア)」があります。Gangliaで一元管理できる主な内容は以下の通りです。
これらの情報は、時系列のグラフとしてWebブラウザで表示することも可能です。 ![]() 図1:Gangliaによるブレードサーバの監視 Gangliaを導入して管理サーバを構築するには、Gangliaをインストールしたサーバ上にHTTPサーバも同時に構築しておく必要があります。一方、Gangliaの管理対象となる各ノードには「gmond」と呼ばれるデーモンを動作させておきます。 |
||||||||||
|
1 2 3 次のページ |
||||||||||
|
|
||||||||||
|
|
||||||||||
|
||||||||||
|
|
||||||||||
|
||||||||||
|
|
||||||||||
|
||||||||||
|
|
||||||||||
|
||||||||||
|
|
||||||||||
|
||||||||||
|
|
||||||||||
|
||||||||||
|
|
||||||||||
|
||||||||||
|
|
||||||||||
|
||||||||||
|
|
||||||||||
|
||||||||||


