監視対象のサーバでシステム障害時や正規の運用と異なる操作が行われた場合に出力されるログを監視することで、システム障害や不正なアクセスなどを早い段階で認識することができます。
例えば、監視対象のサーバでDISK障害が発生した場合には、以下のようなログが出力されます。
kernel: I/O error: dev 08:00, sector 0
このようなログが出力されたら、メッセージ通知するように設定することができます(図8)。
図8:「I/O error」を監視する設定例 (画像をクリックすると別ウィンドウに拡大図を表示します)
このメッセージを監視することで、DISKの障害を迅速に把握することができます。このログが出力されてもすぐにDISKが読み出し不能にならない場合もあるので、不調ではあるがまだ読み出しが可能な状態で、DISKの交換などの対処ができることもあるでしょう。
なおシステムの運用中に監視しなければならないことは障害だけとは限りません。Linuxでは、ユーザの認証に失敗すると以下のようなエラーが表示されます。
sshd(pam_unix)[1905]: authentication failure; logname= uid=0 euid=0 tty=ssh ruser= rhost=host1 user=root
このようなログが不自然に多く出力されている場合には、正規のユーザでない誰かが管理対象のマシンにアクセスしようとしている可能性があります。このメッセージを監視対象とすれば、実行しているアクセス元の解析など不正アクセスをされる前に措置をとることが可能です。
このようにHinemosでは、今までオープンソースソフトウェアの運用監視ツールでは実現できなかったいろいろな運用監視項目を統一的に監視することができるようになります。これにより管理者はシステムの障害や障害に繋がる事象に対して、迅速で効果的に認識することができ、運用保守負荷の低減を実現することができます。
|