|
||||||||||||
| 1 2 3 4 次のページ | ||||||||||||
| はじめに | ||||||||||||
|
前回は警報通知やサーバメンテナンスなどの保守ツールを紹介しましたが、今回はいよいよBig Brother(以下、BB)システムに機能拡張をプラグインします。 |
||||||||||||
| 障害予測を可能とする経過監視 | ||||||||||||
|
BBはネットワーク監視を行うツールであり、これを使うことによってネットワークの稼働状況を簡単に把握することができます。 安定稼働のためにはリソースの使用状況管理が必須となります。BBでは、プローブクライアントによるリソース監視機能を備えていますが、BBで検知できる障害はあくまでも現在の状況に限られます。 稼働データの使用経過を時系列に整理・グラフ化すると将来のリソース不足などの予測も可能となります。 図1と図2はWebサーバのディスク使用率の経過をグラフ化したものです。図1は48時間周期の短期レンジ、図2は576日周期の長期レンジで集計しています。 短期レンジ(図1)ではほぼデイリーバッチによる変化で大きな変化はみえませんが、長期レンジ(図2)での経過をみてみると/exportパーティションが緩やかな上昇傾向をたどっていることがわかります。グラフの傾きからおおよそのディスク増設の時期を予測することで、事前に障害を防ぐことが可能となります。 この手法は経過監視と呼ばれ、主にネットワークのインターフェースのトラフィック監視やサーバの内部リソース監視に用いられます。増加傾向・減少傾向などのトレンドだけでなく、周期的な状況変化の把握にも用いられます。 経過監視のためのツールとしてはMRTG(Multi Router Traffic Grapher)が有名であり、MRTGを使ったトラフィック監視システムを別に立ち上げられている方もいるのではないかと思います。 |
||||||||||||
| グラフ化ツールLARRD | ||||||||||||
|
ネットワーク監視ツールによる稼動状況確認は、定期的な稼働情報収集という見方もできます。これは経過監視のための定期的な情報収集とまったく同じ作業です。BBの監視によって収集した情報のグラフ化ができれば、BBで経過監視も同時にできます。これを実現したのが今回紹介する機能拡張ツールLARRD(Load Average RRDtool)です。 LARRDはBBの監視情報から経過監視グラフを作成します。LARRDをBBに追加すると、監視TOP画面にて各監視対象の監視項目アイコンに"trends"という項目が追加されます(図3)。 このアイコンが経過監視グラフへのリンクになっており、これをクリックすると図4のような監視対象の監視リソースをグラフ化した情報画面が表示されます。 グラフ化される項目は各監視対象で監視している項目によって変わります。ルータやスイッチなど単純にIP死活監視やサービス稼働監視のみをしているノードの場合、監視サービスの応答時間のみがグラフ化されます(図5)。 サーバなどのプローブクライアントBBCLIENTをインストールしている監視ノードにおいては、プローブからの情報を用いてCPU/ディスク使用率/プロセス数/ログインユーザ数などの情報をIP/TCPサービス応答時間とあわせてグラフ化されます(図6)。 作成されるグラフはRRDtoolの機能により時間別/日別/週別/月別の4つのレンジのものが作成され、48時間周期の短期トレンドから、578日周期の長期トレンドまでをひと目で把握できるようになります。 LARRDはあくまでもグラフ化に特化した拡張スクリプトであり、記録した値が正常値なのか、異常値なのかという判断はしません。こちらはDISK使用率監視やCPU使用率監視、サービス正常性確認などの各監視機能に任せることになっています。この点は注意しましょう。 |
||||||||||||
|
1 2 3 4 次のページ |
||||||||||||
|
|
||||||||||||
|
|
||||||||||||
|
||||||||||||
|
|
||||||||||||
|
||||||||||||







