GUIによる効率的なシステム管理、監視
ディスク使用率とCPU使用率にしきい値を設定して通知する無料のGUIツール
sarコマンドは、リアルタイムでサーバーのリソースを取得し、このうえでテキスト・データの数値を目視で行う運用や、過去の履歴を閲覧して解析を行うといった運用に威力を発揮します。
この一方で、現在稼働中のシステムでリソースが不足気味になった場合に、その状況を管理者に通報させたい場合があります。特に、ディスク使用量やCPU使用率が高くなると、システムのパフォーマンスに大きく影響するため、システム管理者にいち早く知らせておきたい、という場合が少なくありません。
この場合、ディスク使用量やCPU利用率にしきい値を設定し、そのしきい値を超えていないかどうかの監視を行うのが一般的です。しかし、スクリプトによる作り込みなどを行わなくても、簡単に設定できるGUIツールがベンダーから提供されています。
HP ProLiantサーバーの場合、オープンソースではありませんが、無料で提供されているHP System Management Homepage(通称SMH)とよばれるGUIツールがあります。ディスク使用量とCPU利用率のしきい値を、Webブラウザから簡単に設定できます。
ディスク使用量 | CPU利用率 |
図12: HP System Management Homepageによるディスク使用量(左)とCPU利用率(右)のしきい値をGUIで設定している様子。管理者へのメール通知、SNMP通知、ログ出力も容易に設定できる(クリックで拡大) |
HP SMHは、WebブラウザからCPU利用率とディスク使用量のしきい値を設定でき、しきい値を超えると、/var/log/messagesにログを残し、管理者にメール通知します。また、別途構築したHP Insight Controlなどの管理サーバーに、SNMPによる通知も行います。
管理者にメール通知を行うためには、/opt/hp/hp-snmp-agents/cma.confファイルに、trapemailから始まる記述を挿入します。以下は、管理者のtestuserに監視エージェントからメール通知を行う設定例です。
# vi /opt/hp/hp-snmp-agents/cma.conf … trapemail /bin/mail -s 'ProLiant DL360G7 + RHEL6 Trap Alarm' testuser …
ファイルを編集したら、hp-snmp-agentsサービスを再起動しておきます。
# /etc/init.d/hp-snmp-agents restart
CPU利用率のしきい値をGUIで設定したら、ddコマンドなどによりCPUに負荷を与えて、テストを行うとよいでしょう。
# dd if=/dev/urandom of=/dev/null
ディスクの使用量のテストも、ddコマンドなどによりテスト・データを作成し、システムに影響が及ばない範囲でディレクトリを圧迫させて、テストしてみるとよいでしょう。
以上、GUIベースの管理ツールを使った、ハードウエア・リソースの基本的な監視方法を解説しました。
オープンソースのsarコマンドによる性能データの保存、kSarによる性能データの履歴の確認や傾向の把握、グラフ作成、そしてHP SMHによるしきい値設定と管理者への通知を組み合わせれば、比較的少ない工数で、システムの状態を詳細に管理、監視できるようになるはずです。
最近のパブリック・クラウド・システムや仮想化技術を駆使したホスティング・サーバー・システムなどでは、仮想化環境を含めたシステム管理や監視、ハードウエア調達時間の短縮、社内サーバー・システム配備の迅速化、電力やスペースを含めた運用コスト削減の効率化や予測が、課題になっています。コマンド・ラインだけの管理では、もはや限界が来ています。
OSに付属しているGUIツールや、オープンソースで入手できる優秀な監視ツール、ベンダー提供のGUIツールを組み合わせれば、膨大なサーバーで構成されたシステムを、簡単に監視できるようになります。
オープンソースのGUIツールは、膨大な数が存在しますが、使いやすくても自社のシステムの目的を達成できなければ、あまり意味がありません。本連載で掲載したツールは、あくまでも一例に過ぎませんが、汎用性が高いと思われるものを紹介しました。紹介したオープンソース・ソフトウエアを駆使することで、自社システムで抱えている課題を解決できそうかどうか、今一度考えてみてください。