TOPサーバ構築・運用【ネットワーク教習所】サービスを守るネットワーク監視> 第1回:サービスを止めないために (2/3)

【ネットワーク教習所】サービスを守るネットワーク監視

【ネットワーク教習所】
サービスを守るネットワーク監視

第1回:サービスを止めないために

著者:シンクイット編集部

公開日:2008/03/06(木)

ネットワークの状況を監視する

提供するサービスを動かしているシステムの構築段階で、障害やトラフィックの増加などを想定するのは当然のことである。また、テスト段階においても、システムが停止した場合や、想定の負荷をかけた場合の検証を行っている。しかし、実際には運用してみてはじめてわかることも多い。

例えば、利用しているアプリケーションのバグなどが見つかったり、想定していた負荷が予想以上に大きかったりする場合である。そしてそれらはリアルタイムにやってくるのである。これらの想定外の問題は、防ぎようのないものが往々にして多い。

これらの問題をただ手をこまねいて見ているだけでは、何も進展はしない。つまり、問題の情報を把握し、対応する必要があるのだ。

そこで登場するのがネットワーク監視である。ネットワーク監視とは、システムの障害やパフォーマンスの低下を定期的に監視するシステムのことである。

ネットワーク監視を行うソフトウェアでは、障害やパフォーマンスの低下が発生した場合、電子メールなどで通知してくれるため、すばやい対応につなげることができる。ネットワーク監視を行うソフトウェアには、オープンソースソフトウェアやプロプライエタリソフトウェアそれぞれがある。また、特定のプロトコルを監視するものや、幅広いプロトコルに対応したものなど、種類が豊富だ。

オープンソースソフトウェアのネットワーク監視ソフトウェアについては「オープンソース統合監視ツール導入指南」と題して、「Nagios」「Hobbit」「ZABBIX」「Hinemos」の4つの比較記事を掲載しているので、参考にしていただきたい。

Image

障害の解析

さて、障害が発生したことがわかったとして、次にハードウェア/ソフトウェアなど、発生部位の切り分けを行い、原因の究明を行っていく必要がある。システムが止まったことがわかり、再起動でシステムが復旧したとしても、その原因がわからなければ、真の解決にはつながらない。

なぜならば、再び同じ障害が発生する危険が残っているからである。原因の究明を行い、その対応策を講じて、実際に対策を行ってはじめて解決するのである。

原因の究明には、サーバのログをはじめとしたさまざまな情報が必要となる。それらの情報を収集し、解析することが望ましいだろう。ネットワーク監視ソフトウェアには、それらの一元的に管理できるものもあり、これらを利用すると障害の解析もスムーズに進められるだろう。 次のページ



INDEX
第1回:サービスを止めないために
  増え続けるサービスとその変化
ネットワークの状況を監視する
  パフォーマンスも求められる