ソフト開発
企業IT
製品導入

Think IT（シンクイット）

Think IT（シンクイット）

人気記事ランキング
Kaggleは「キャリアの再定義」に役立つー文系営業がKaggler会で得た、挑戦の連鎖と新しい自分
7月24日 6:30

「PyTorch 2.13」リリース ─ FlexAttentionのApple Silicon対応など
7月11日 12:42

「deepin 25.2.0」リリース ─ Debianベースのデスクトップ向けディストリビューション
7月9日 0:51
人気記事をもっと見る
人気コーナーランキング
Kaggleは「○○」に役立つ
最新記事： 2026年07月24日

Windowsユーザーのための WSL2で始める Linux環境構築術
最新記事： 2026年05月14日

イベント・セミナー2026
最新記事： 2026年07月27日
人気コーナーをもっと見る
カテゴリ
ITインフラ
サーバー
ネットワーク
ストレージ
クラウド
仮想化／コンテナ
IoT／組み込み
システム開発
OS
ミドルウェア
データベース
設計／手法／テスト
開発言語
開発ツール
Web開発
業務アプリ
クラウド（SaaS）
データ解析
モバイル
CRM／ERP
OSS
VR／AR
AI・人工知能
運用・管理
プロジェクト管理
システム運用
BCP／DR
運用監視
セキュリティ
働き方
資格・試験
キャリア・人材
フリーランス／起業
ライフハック
教育
制度・法律
種別
ニュース
技術解説
書籍・書評
インタビュー
イベント
コラム
TechAcademy
ReadWrite
タイプ
- 記事
- ニュース
連載
現場エンジニアのための「Proxmox VE」活用術
最新記事： 2026年07月31日

月刊Linux Foundationウォッチ
最新記事： 2026年07月31日

編集部が読み解く! 3行でわかるテックニュース
最新記事： 2026年07月30日

「クラウドネイティブ会議」レポート
最新記事： 2026年07月30日

脆弱性診断の現場から
最新記事： 2026年07月29日

KubeCon＋CloudNativeCon Europe 2026レポート
最新記事： 2026年07月29日
連載をもっと見る
特集
【レガシーモダナイゼーション新潮流】AIが変えるモダンアーキテクチャへの移行

テスト自動化ガイド 2024

生成AI完全ガイド 2024

IT運用管理ガイド 2023

DevOps完全ガイド 2023

クラウドデータベース完全ガイド 2023
特集をもっと見る

よく検索されるワード

クラウド時代の正しいシステム運用第5回

システム運用における、5つの大間違いとは（4）［2ページ目］

負荷の原因追求は難しい

このようにシステムが変遷していくなかで、運用監視の場面では、いまだに個々のサーバー負荷を確認し、閾値を設け、閾値を超えた場合に障害として検知する手法を採用するケースが多く見受けられる。その閾値が適切かどうかという指摘ももっともだが、そもそも複数の機能を持つサーバーの負荷は、予測できるものなのだろうか。

サーバー負荷の予測は、「負荷上昇の原因となる機能が何なのか」「その機能を別サーバーに移動させれば問題は解決するのか」「別サーバーの負荷はどうなるのか」などといった複合要因が入り組んでいるため、なかなか負荷上昇の原因をつかむことは難しいものである。

そこで、このようなシステムを運用管理する運用担当者がまず行うべきことは、運用担当者自身の存在意義であるところの、「システム全体でサービスが利用可能であることを保証すること」である。言い換えると、「システム全体を俯瞰したうえで、サービスの価値を最大限に高めること」なのである。

サービスの価値を高めるために必要な監視ポイント

一方で、サービス利用者の立場に立ってみれば、「サービスが利用可能でさえあれば、サーバーの負荷などどうでもよい」のである。サービスが利用できなければ、その原因などはどうでもよいから利用可能な状態に戻してくれ、と利用者が思うことは容易に想像できるだろう。

しかし、システムの負荷状況といった些細な面に対して、ある一定の閾値を設けて監視・障害検知している例は多い。このことは、システムの問題を分析するための1つのデータにはなりうるが、障害検知してアラートをあげることには、ほとんど意味がない。

運用技術者の、サービスの価値を高めるために必要な監視ポイントは、

負荷上昇なのかそうでないのか
何を障害として検知すべきなのか

を日々考えることであり、それが運用技術者の業務なのである。

Sはその後、「DBサーバーの価値が応答時間で決まること」「応答時間が遅くなる原因の1つにディスクI/Oがあること」を勉強し、T先輩のすばらしさをひしひしと感じるのであった。

この記事のキーワード：

この記事をシェアしてください

人気記事トップ10

人気記事ランキングをもっと見る

新着記事

「Proxmox VE」とは? 製品群の全体像と仮想化基盤として注目される理由 7月31日 6:30 LFがOSSの脆弱性協調対応イニシアティブ「Akrites」を発足、CRA準備状況レポートは改善どころか悪化、ほか 7月31日 6:20 NVIDIAら37社が「Open Secure AI Alliance」設立――AIエージェントのセキュリティは重みの非公開では守れない 7月30日 6:20 【クラウドネイティブ会議】厳格な統制と開発者体験を両立する、Wiz Baseにおけるゴールデンパスの実践 7月30日 6:00 その「ソーシャルログイン」は大丈夫? OAuth/OIDC実装の3つの落とし穴 7月29日 6:30

企画広告も役立つ情報バッチリ！ Sponsored

機能安全開発におけるGoogleTestの活用を支援!「Parasoft C/C++test CT」で実現する効率化＆AI連携 4月14日 6:30 【CNDW2025】Grafanaが明かす「オブザーバビリティの哲学」ー最小限の労力で実用的なインサイトを得るには 1月23日 6:30 【CNDW2025】プロダクト急増に備える基盤刷新ーウェルスナビがECSからEKSへの移行で得た知見とは 1月15日 6:30 【CNDW2025】250環境を5人で運用、構築時間は30分にーKINTOテクノロジーズが語るインフラ基盤組織の作り方 2025年12月18日 6:30 新たな自動化で熱視線！ AIエージェントの「推論能力」を支える2つのコンポーネントとは？ 2025年11月28日 6:30 IoTに生成AIを掛け合わせる「AI-driven IoT」で現場のIoTデータ活用を加速 2025年11月26日 6:30 アイレット、KDDIの属人化問題を生成AIアシスタントの精度を高め解消へ 2025年11月21日 6:30 「Grafana Cloud」の先進的ユーザーであるグリーが10年をかけて到達した「オブザーバービリティ」とは 2025年5月15日 6:30 Grafana Labs CTOのTom Wilkie氏インタビュー。スクラップアンドビルドから産まれた「トラブルシューティングの民主化」とは 2025年4月21日 6:30 API管理をより簡単にする「Kong Konnect」が解決する課題とその主要機能 2025年3月5日 5:30

Tweets by thinkitcojp