【ネットワーク教習所】
サービスを守るネットワーク監視
第1回:サービスを止めないために
著者:シンクイット編集部
公開日:2008/03/06(木)
ネットワークの状況を監視する
提供するサービスを動かしているシステムの構築段階で、障害やトラフィックの増加などを想定するのは当然のことである。また、テスト段階においても、システムが停止した場合や、想定の負荷をかけた場合の検証を行っている。しかし、実際には運用してみてはじめてわかることも多い。
例えば、利用しているアプリケーションのバグなどが見つかったり、想定していた負荷が予想以上に大きかったりする場合である。そしてそれらはリアルタイムにやってくるのである。これらの想定外の問題は、防ぎようのないものが往々にして多い。
これらの問題をただ手をこまねいて見ているだけでは、何も進展はしない。つまり、問題の情報を把握し、対応する必要があるのだ。
そこで登場するのがネットワーク監視である。ネットワーク監視とは、システムの障害やパフォーマンスの低下を定期的に監視するシステムのことである。
ネットワーク監視を行うソフトウェアでは、障害やパフォーマンスの低下が発生した場合、電子メールなどで通知してくれるため、すばやい対応につなげることができる。ネットワーク監視を行うソフトウェアには、オープンソースソフトウェアやプロプライエタリソフトウェアそれぞれがある。また、特定のプロトコルを監視するものや、幅広いプロトコルに対応したものなど、種類が豊富だ。
オープンソースソフトウェアのネットワーク監視ソフトウェアについては「オープンソース統合監視ツール導入指南」と題して、「Nagios」「Hobbit」「ZABBIX」「Hinemos」の4つの比較記事を掲載しているので、参考にしていただきたい。
障害の解析
さて、障害が発生したことがわかったとして、次にハードウェア/ソフトウェアなど、発生部位の切り分けを行い、原因の究明を行っていく必要がある。システムが止まったことがわかり、再起動でシステムが復旧したとしても、その原因がわからなければ、真の解決にはつながらない。
なぜならば、再び同じ障害が発生する危険が残っているからである。原因の究明を行い、その対応策を講じて、実際に対策を行ってはじめて解決するのである。
原因の究明には、サーバのログをはじめとしたさまざまな情報が必要となる。それらの情報を収集し、解析することが望ましいだろう。ネットワーク監視ソフトウェアには、それらの一元的に管理できるものもあり、これらを利用すると障害の解析もスムーズに進められるだろう。 次のページ