ネットワーク障害と管理ツールの機能
代表的な管理ツールの機能
ネットワークを管理するにあたり、慣れた技術者であれば、コマンド・ラインを駆使すれば、現在の状況を確認する程度のことはできるだろう。しかし、過去に遡ったり、統計を見たい、となると、何らかのツールを使う必要がある。
ここでは、一般的な管理ツールが持っている代表的な機能を、いくつか紹介しよう。
- 機器の死活監視(PingによるICMPポーリング)
- 稼働状況とシステムリソースの監視(SNMPトラップ、SNMPポーリング)
- ログ収集(syslog)
(1)機器の死活監視
機器の死活監視は、主にICMP(Internet Control Message Protocol)などのプロトコルを利用したものだ。監視サーバーから、対象となるネットワーク機器に対してデータを送り、応答の有無によって機器の状態を判断する。応答があればその機器は稼働中で、応答が無ければ稼働していない、とする単純な仕組みである。
応答しない理由は複数あるため、原因の判断には、知識や経験を必要とする。監視サーバーと対象機器の間で何らかの障害が発生している場合にも、応答は返ってこない。
(2)稼働状況とシステム・リソースの監視
運用・監視は、ネットワーク機器の死活監視だけをしていれば安心というものではない。機器間のLink状態や機器内部のリソースの状態を把握しておく必要もあるだろう。
これらは、RFC1157で規定されているSNMP(Simple Network Management Protocol)を使って監視するのが簡単だ。SNMPの仕組みは、SNMPマネージャと呼ばれる監視装置と、監視対象である機器(SNMPエージェント)によって構成する。
SNMPエージェント内には、MIB(Management Information Base)と呼ぶ、ステータス情報を格納するデータベースがある。このデータベースから情報を取り出して、SNMPマネージャへ通知する。この通知のことをトラップと呼ぶ。トラップを投げるタイミングは、イベント発生時や、あらかじめ設定したしきい値に達した場合などだ。最終的に、管理者へメールで通知するすることもできる。
SNMPマネージャからの定期的なポーリングによって対象機器のCPU負荷やメモリーの使用率などのリソース使用状況を監視しておくことで、各種の情報が分かる。例えば、普段は低いL2スイッチのCPU負荷が、MACアドレス・テーブルへの書き込みやSTPの計算、フィルタリングによる特定トラフィックの遮断などによって高まっていることが分かる。また、MACアドレス・テーブルの情報を維持するためにメモリーの使用率が上昇していることが分かる。これらが分かることで、パケットが破棄されるようなトラブルを未然に防ぐことができる。
図2: SNMPマネージャとエージェント間の通信(クリックで拡大) |
(3)ログ収集
ログ収集にはsyslogを使う。機器のLink Up/Downを含めたステータス情報、コンソール接続やリモート接続によるアクセス、トラフィックに関するログなど、syslogを使えば、システム内で行われた処理を記録できる。問題発生時には、SNMPトラップによるアラート情報から障害の発生した機器、発生日時を調べ、障害発生前後のsyslogを確認する。こうすることで、原因究明を行うことが可能だ。
ただし、ログには、正常であることを表す情報も、異常を示す情報も、混在した形で記録されている。膨大なログの中から問題に関係するものだけを抽出するのは、大変な作業となる。ログから原因を見つけ出して問題を解決するのが最終的なゴールだが、情報システム部門を設置している企業でも、ほんの一部の管理者しか問題を解決できないのが実情だ。
紹介した以上の機能以外でも、管理ツールとして、以下のような機能を備えていれば、管理者の負荷は大幅に減るだろう。
- マップ機能(地図上に機器を表示し、障害発生ヶ所を視覚的に表示する)
- ダッシュボード機能(リアルタイムの統計、障害情報の表示など)
- レポート機能(指定した期間指定した情報に関する統計を出力)
一般的に、管理ツールは有償で、機能や監視対象の規模に応じて、価格はさまざまだ。およそ20万円から数100万円程度と、決して安くはない
無償のツールもいくつかあるが、機能や監視対象のデバイス数が制限されていたり、汎用であるが故に管理したい項目などを自分でカスタマイズしなければならないケースが多い。もちろん、ツール自体のサポートもなく、カスタマイズも容易ではない。
こうした状況の下、これまで紹介してきたSGスイッチでは、Visual Node Manager(以下VNM)と呼ぶ無償の管理ツールが提供されている。無償とは思えないほどよくできている。
テーブル1は、一般的な有償の管理ツールとの比較である。ほかのツールにあってVNMに無い主要な機能は、アラートの通知ぐらいのものだろう。
【テーブル1】管理ツールの比較
一般的なツール(有償) | VNM(無償) | |
---|---|---|
死活監視 | ○ | ○ |
稼働監視 | ○ | ○ |
システム・リソース監視 | ○ | ○ |
ログ取得 | ○ | ○ |
マップ機能 | ○ | ○ |
ダッシュボード機能 | ○ | ○ |
レポート機能 | ○ | ○ |
通知機能 | ○ | サウンドのみ |
デバイス制限 | ライセンス制 | 無し |
OS | UNIX/Linux/Windows | Windows |
ただし、VNMは、管理者への通知が警報音に限られる。メールやそのほかの方法で通知する仕組みはない。2011年には、Visual IP Manager(VIPM)と呼ぶアプライアンス製品をリリースする予定で、この製品では、SGスイッチと連携することで、IPレベルで不正PCの排除や通知ができるようになる。
VNMの通知機能も拡充される予定だが、実際のところ、問題が発生した時にメールが使える状態にあるとは限らないため、メール通知機能が本当に必要なのかどうかは分からない。問題があれば、VNMの画面を見ればよいのではないだろうか。