TOPサーバ運用・構築> Linuxシステムのハードウェア管理と障害監視




改めて知っておきたいRed Hat Enterprise Linux 4
改めて知っておきたいRed Hat Enterprise Linux 4 - 管理ツール編

第1回:現実路線のサーバ管理ソフトウェア
著者:日本ヒューレットパッカード  古賀 政純   2006/11/24
1   2  3  次のページ
Linuxシステムのハードウェア管理と障害監視

   大量のサーバが導入されている場合や、サーバのハードウェアやOSの種類が異なるという環境で管理者の工数を低減することは非常に重要です。特にサーバの負荷状態や障害状況、アプリケーションの稼動状況を瞬時に把握したいというニーズは昔から消えることはありません。

   シェルスクリプトを使用してシステム情報を収集する手法は、システム導入の際に非常に有用なツールとなります。管理者や導入業者が保守サポート業務を行う場合、工数の削減に役立つことでしょう。しかしこれらのスクリプトを大量のサーバで実行し、ログを収集し、すべてに目を通して異常がないかを管理者がチェックするのは非常に煩雑な作業です。

   管理者にとって必要なのは、システムに障害が発生しているか、システムがうまく稼動しているかといった結果だけであり、対象となる数百台ものサーバにログインしてスクリプトを流し、大量の監視項目をチェックする方法は非現実的です。

   そこで、複数のサーバを一元管理して自動的にシステム情報を取得し、障害情報をリアルタイムで監視できる手法が必要になります。いわゆる「管理、監視ソフトウェアによる一元管理」と呼ばれるソリューションです。

   本連載では、このソリューションを実現し、Linuxシステムのハードウェアの管理や障害監視を行うソフトウェアについて紹介します。

オープンソースのサーバ管理ソフトウェア「Ganglia」

   リモートにある大量のサーバ(=管理対象ノード)を一元管理できるオープンソースの管理ソフトウェアとして有名なものの1つに「Ganglia(ガングリア)」があります。Gangliaで一元管理できる主な内容は以下の通りです。

  • CPU周波数、CPU個数、CPU負荷状況
  • メモリ容量、メモリ使用量
  • カーネルバージョン
  • OSの稼動時間
  • スワップ容量
  • ネットワークトラフィック

   これらの情報は、時系列のグラフとしてWebブラウザで表示することも可能です。

Gangliaによるブレードサーバの監視
図1:Gangliaによるブレードサーバの監視

   Gangliaを導入して管理サーバを構築するには、Gangliaをインストールしたサーバ上にHTTPサーバも同時に構築しておく必要があります。一方、Gangliaの管理対象となる各ノードには「gmond」と呼ばれるデーモンを動作させておきます。

1   2  3  次のページ


日本ヒューレット・パッカード株式会社 古賀 政純
著者プロフィール
日本ヒューレット・パッカード株式会社
古賀 政純

2000年よりUNIXベースのHAクラスタシステム及び、科学技術計算システムのプリセールスに従事。並列計算プログラミング講習会などを実施。その後、大手製造業及び官公庁系の大規模Linuxクラスタの導入、システムインテグレーションを経験。現在は、大規模エンタープライズ環境向けのLinuxブレードサーバ及びHP Serviceguard for Linux(HAクラスタソフトウェア)のプリセールスサポート、システム検証を担当している。毎日、Linuxサーバと寝食を共に(?)しています。


この記事の評価をお聞かせください
ボタンをクリックしますとウインドウが開きます。

INDEX
第1回:現実路線のサーバ管理ソフトウェア
Linuxシステムのハードウェア管理と障害監視
  Gangliaサーバの入手とインストール
  gmetadサービスを起動
改めて知っておきたいRed Hat Enterprise Linux 4 - 管理ツール編
第1回 現実路線のサーバ管理ソフトウェア
第2回 手軽なWeb管理ツールと強力な専用ツール
改めて知っておきたいRed Hat Enterprise Linux 4 - サーバ編
第1回 ブレードサーバとLinux
第2回 HAクラスタとバックアップ
第3回 データレプリケーションとWebサーバの構築の基本
改めて知っておきたいRed Hat Enterprise Linux 4 - インストール編
第1回 Red Hat Enterprise Linuxの概要
第2回 インストールの方法とサポート状況の確認
第3回 インストールとNICの設定
第4回 インストール後に行う設定
改めて知っておきたいRed Hat Enterprise Linux 4 管理編
第1回 外部ストレージの設定と運用について
第2回 RHEL4におけるユーザ管理
第3回 RHEL4におけるシステム管理とSIMについて
第4回 RHEL4におけるOSのチューニング
改めて知っておきたいRed Hat Enterprise Linux 4 - ネットワークサービス編
第1回 Webサーバの基本「Apache」
第2回 3つのファイルサーバ「NFS & FTP & Samba」
第3回 IPアドレスを管理する「DHCPサーバ」と通信の橋渡し「NATルータ」
第4回 NATサーバに必要なファイアウォール設定とデータベースサーバ、メールサーバ
改めて知っておきたいRed Hat Enterprise Linux 4 - バックアップ編
第1回 オープンソースMondo Rescueによるバックアップ手法
第2回 NetVault for Linuxを使ったバックアップ
改めて知っておきたいRed Hat Enterprise Linux 4 - クラスタ編
第1回 LinuxでもHAクラスタ
第2回 Serviceguard for Linuxでクラスタ環境の管理