|
|
前のページ 1 2 3 4
|
|
SNMPを使ったハードウェア監視ツール
|
IPMIによってハードウェアコンポーネントの情報を取得したり、GangliaによってOSから見えるハードウェアの利用状況を時系列に閲覧して管理することは非常に重要です。しかし、これらハードウェアコンポーネントに障害が発生した場合に、管理者へ通知される仕組みも必要です。
Linuxサーバにおける一般的な障害監視としてはSNMPによる監視ツールの導入があげられます。SNMPを使った障害監視を行うオープンソースソフトウェアとしては「Nagios」などがありますが、オープンソースのSNMP監視ツールの多くは設定が難しく、サーバから取得できるハードウェア情報も限られるため、思うような管理ができない場合も少なくありません。
SNMPによる障害監視においては、ハードウェアベンダーがリリースしている監視ソフトウェアとエージェントを組み合わせると非常に簡単にシステムを構築することができます。これらの監視エージェントと管理ソフトウェアはハードウェアベンダーのWebサイトから無料で入手して組み込むことが可能です。
ProLiantサーバの場合、「ProLiant Support Pack for Linux」と呼ばれるLinuxサーバの監視エージェントを管理対象にインストールし、SNMPの設定を行います。SNMPの設定もコマンド1行で行うことができ、対話形式の質問に答えるだけで非常に簡単に構築することができます。
# /etc/init.d/hpasm reconfigure
|
サーバのCPUやディスクのリソース監視
|
ハードウェア監視以外にも、監視対象のサーバのCPUやディスクのリソース監視も非常に重要です。CPUやディスク使用率に閾値を設定しておき、管理者に通知する仕組みなども監視エージェントで簡単に設定することが可能です。
以下にディスクの閾値設定をGUIにより行っている様子を示しています。これらの閾値の管理は管理対象サーバの監視エージェントが行っていますが、管理者はGUIからマウス操作により閾値を簡単に設定することができます。
図4:GUIによるディスク使用量に関する閾値の設定 (画像をクリックすると別ウィンドウに拡大図を表示します)
また監視対象サーバで障害が発生した場合やCPU利用率やディスク利用率が指定した閾値を超えた場合、管理者にメールで通知させるような監視の設定も監視エージェントの設定ファイルで設定できるようになっています。
監視対象サーバでの監視エージェントのメール通知設定例
# vi /opt/compaq/cma.conf
trapemail /bin/mail -s 'HP IMA Trap Alarm to testuser' testuser
図5はSNMP監視エージェントによって管理ユーザtestuserにメール送信された例です。
図5:SNMPエージェントによるメール通知の例 (画像をクリックすると別ウィンドウに拡大図を表示します)
監視サーバ側はSystems Insight ManagerなどSNMP対応の監視ソフトウェアを構築しておくことで、監視対象サーバのコンポーネントに障害が発生した場合のSNMPトラップを受信することができます。最新のSystems Insight ManagerではLinuxベースのHAクラスタ状況やHAアプリケーションの状況までSNMPで取得することができるようになっており、管理者はハードウェア、HAクラスタミドルウェア、HAアプリケーションの障害状況を単一の管理画面で一元監視することができるようになっています。
図6はSNMPによるハードウェア監視、HAクラスタ監視、HAアプリケーション監視の様子です。SNMPによって非常に多くのコンポーネントを監視でき、SNMPのイベントを管理者に通知できていることがわかります。
図6:SNMP監視ツールによるハードウェア、HAアプリケーションの一元監視 (画像をクリックすると別ウィンドウに拡大図を表示します)
これらのハードウェア及びリソース監視を行う「監視エージェント」や「監視ソフトウェア」は、単に管理対象サーバの状態を見るという業務形態だけでなく、管理者へのメール通知やイベント履歴の参照、レポート生成機能など様々な監視業務に対応できるように設計されています。
|
ソフトウェアを組み合わせて楽々サーバ管理を実現しよう
|
オープンソースの管理ソフトウェアやベンダーが提供する監視ソフトウェアなどをうまく組み合わせることで、より柔軟な管理業務に対応できるようになります。しかし便利だからといって、やみくもに管理ソフトウェアをいくつも導入するのは問題です。
注意しなければならないことは、管理者は自社のシステムに必要な管理業務がどのようなもので、導入するメリットは何かを見極める必要がある点です。本当に導入すべき管理、監視ソリューションは何かを十分検討してください。
|
前のページ 1 2 3 4
|
|
|
|
著者プロフィール
日本ヒューレット・パッカード株式会社 古賀 政純
2000年よりUNIXベースのHAクラスタシステム及び、科学技術計算システムのプリセールスに従事。並列計算プログラミング講習会などを実施。その後、大手製造業及び官公庁系の大規模Linuxクラスタの導入、システムインテグレーションを経験。現在は、大規模エンタープライズ環境向けのLinuxブレードサーバ及びHP Serviceguard for Linux(HAクラスタソフトウェア)のプリセールスサポート、システム検証を担当している。毎日、Linuxサーバと寝食を共に(?)しています。
|
|
|
|