システム運用における本当の意味の「効率化」「高品質化」「コスト削減」
この連載でこれまで述べてきたことで、クラウド時代の21世紀型のシステム運用では、これまでとは違った視点を設計に取り入れていく必要があるということを、理解していただけただろうか。
システム運用の基本となる監視のあり方が見えてきたところで、次は、システム運用全体に話を広げていこう。
効率化や高品質化、さらにはコスト削減をしながら、21世紀型の運用を実践していくにはどうしたらよいだろうか。本項では運用設計のあるべき姿を、「効率化」「高品質化」「コスト削減」とともに実現するための手法を、さらに具体的なツールやサービスの紹介も含めて説明する。
ここでのポイントは、次の2点である。
- 決まりきったオペレーションは、徹底的に仕組化、システム化する。
- 技術者は、問題改善や次期システムの設計へつなげる業務へ配置する。
オペレーションのシステム化で「効率化」「高品質化」「コスト削減」を実現
まず、オペレーションにおいては、「5つの大間違い」でも述べた通り、ここに人的リソースを投入してもシステム運用はうまくいかない。この部分は、システム化を最大限行うことによって、「効率化」「高品質化」「コスト削減」が大きく進むのである。
システム運用におけるオペレーション作業には、定期的なプロセス再起動、障害発生時の手順に従った対応などがある。そもそも、障害発生時に決まった連絡先に、メールや電話で「連絡」「報告」を行うといった作業も、オペレーションの一部と言える(表1)。これらオペレーション作業は、定型業務であることはご理解いただけると思うが、実はこれらほぼすべてが、システム化が可能なのである。
作業分類 | 内容 |
---|---|
障害検知時の対応 | メール連絡・報告 |
電話連絡・報告 | |
手順に従った操作 | |
プロセス再起動 | |
サーバー再起動 | |
定時作業 | プロセス再起動 |
ログ確認 | |
アプリケーションの動作確認 | |
システムのリソース変化確認 |
これらのオペレーションに対して求められることは、確実性と対応スピードである。特に障害検知時の第一報については、重大な障害であれば、その後の対応を検討し対処方法を決定できる技術者(もしくはサービス担当者)へ、確実に正確な情報が伝わることが重要である。
確実性と対応スピードが求められる場面では、人的な対応よりもシステム化するほうがよいということは、誰もが納得できることだろう。その結果、オペレーションはシステム化するほうが、「効率化」「高品質化」「コスト削減」の実現への近道となるのである。いかにオペレーションに人的リソースを使わないかが、ポイントとなる。