TOP設計・移行・活用> L1〜L3のIP死活監視(IPインフラ部分の監視)
Big Brother
Big Brotherによるネットワーク監視

第1回:ネットワーク監視とは何をするのか
著者:イー・アクセス  矢萩 茂樹   2005/9/14
前のページ  1  2   3  4  次のページ
L1〜L3のIP死活監視(IPインフラ部分の監視)


IP死活監視(IPレベル)
図3:IP死活監視(IPレベル)

   IPネットワークを構成するルータやスイッチと主要サーバなどのネットワークの共通インフラ部分の稼働確認を行なう。pingコマンドによるicmp echo/echo replyの結果でノードの稼働判断を行なう。


L4〜L7のサービス稼働監視(アプリケーションレベルでの監視)

サービス稼働監視(アプリケーションレベル)
図4:サービス稼働監視(アプリケーションレベル)

   サーバが提供するHTTP/SMTP/DNSなどのサーバプロセスに対して擬似的なリクエストを送り、返ってきた返答が正常かを判断することでサービス提供の正常性を確認する。


サービス提供設備のリソース稼働監視

リソース監視(システムレベル)
図5:リソース監視(システムレベル)

   サーバやネットワークノードのCPUやメモリの使用率や、プロセスの起動状態などをクライアントプローブによりサーバに集めることで、対象の稼働リソースに問題がないことを確認する。

   ネットワーク監視は、IPインフラ・サービス稼働状況・サーバのリソース稼働監視をもれなく定期的に行なうことが重要です。

   これら3つの監視はIP層の稼働状態に依存しており、表1のaのIPインフラが稼働していなければb、cともに稼働しません。bのサービス稼働監視はcのサーバリソース監視に相互依存する関係にあり、サーバがオーバーロードしたなどによりサービスが提供不可になっているというような結果になるので、bの障害時はcの障害も一緒にあがってくることが多くなります。


ネットワーク監視システムの必要性

   それではネットワーク監視はどのくらいの作業量になるのでしょうか。概算してみましょう。

   ネットワーク監視の対象はネットワークを構成するルータやスイッチ、サーバなど多くのノード群になります。これらをもれなく定期的に稼働チェックし、稼働不良が発見された時に適切な管理者に通知するというフローになります。単純にいってしまうとこれだけですが、100ノードを5分間隔で24時間IP死活監視した場合の1日の処理量は、以下の計算式による見積もりになります。

1日の監視処理量=100対象×(1日=1440分)÷5分×1処理単位                           =28800処理/日

   単純な処理でも膨大な数を絶えることなくこなさなければならないわけです。

   24時間休みなしに定期的に見なければならないとなると、人手ではコスト的に無理でありシステム化が必須となります。また、障害が発生した際に障害ポイントを迅速に割り出し、確実に障害復旧したことを確認することも重要であり、この部分の効率化はネットワークの稼働率に大きく響いてきます。

   人手で確認することはできないことはないと思いますが、障害通知後に管理者は動くことになるので確実に初動対応は遅れます。障害という異常状態において人は誤った判断をすることが多くなるのも常です。効率的かつ確実に現在のネットワークの稼働状況を整理して管理者にわかりやすく提示できるシステムが求められています。

   以上の業務フローをサポートするのがネットワーク監視システムになります。図1のフローでは(2)〜(6)の部分を効率化し、運用品質を確実に向上させることができます。

前のページ  1  2   3  4  次のページ


イー・アクセス株式会社 矢萩 茂樹
著者プロフィール
イー・アクセス株式会社  矢萩 茂樹
2000年、個人で使えるメガレベルのサービスを目のあたりにして同社立ち上げに参加。ADSLによるブロードバンドIPネットワークの設計・企画に従事。その関連で気軽に使えるネットワーク監視手法についての検討からオープンソースベースのツールをInternetWeekなどで紹介するにいたる。現在、空気媒体のブロードバンド実現に向けて奮闘中。


INDEX
第1回:ネットワーク監視とは何をするのか
  はじめに
L1〜L3のIP死活監視(IPインフラ部分の監視)
  ネットワーク監視ソフト
  障害項目の詳細把握