Cloud Operator Days Tokyo 2021からNTT東日本とKDDIのインフラ監視に関するセッションを紹介
Cloud Operator Days Tokyo 2021から、NTT東日本とKDDIがそれぞれインフラストラクチャー運用の自動化について解説したセッションを紹介する。タイトルはそれぞれ「新入社員が9ヶ月でクラウド運用の自動化システムを作ってみた」「KCPSの運用で直面した仮想化基盤拡大に伴う課題とその対策」で、脱力系とまじめ系という対極のセッションのように思えるが、実際にはどちらのセッションも管理しているインフラストラクチャーから上がってくるアラートやエラーメッセージをどうやって処理するのか? に焦点を定めた内容となっている。
NTT東日本のセッション:新入社員が9ヶ月でクラウド運用の自動化システムを作ってみた
KDDIのセッション:KCPSの運用で直面した仮想化基盤拡大に伴う課題とその対策
新入社員が9ヶ月でクラウド運用の自動化システムを作ってみた
最初に紹介するのはNTT東日本のエンジニア、坂齊史奈子氏のセッションだ。坂齊氏は2020年度の新卒入社で大学では機械工学を専攻しており、入社までプログラミングもクラウドも触ったことがなかったという経歴を持つ。タイトル通りに「新入社員がAWSを9ヶ月触った経験しかない」のに自動化システムを作ったという内容だ。AWSを使い始めたのが2020年6月で、今回の実装のインフラとなるAWSのサーバーレスサービスLambdaを触り始めたのが2020年7月という経験の少なさに驚くかもしれない。
坂齊氏のプロフィールからわかることは、プログラミングやクラウドの知識も経験もなかった新入社員が、この1年間にAWSに関する4つの認定試験をクリアし、社内教育の講師役を担当しているということで、今回のシステムもすべてAWSに特化した内容となっている。
このスライドでは、NTT東日本でAWS上のシステムを運用している際にアラートが頻繁に上がってくることで業務効率が落ちてしまっているという課題を解決するために、人手による処理を自動化することが解説された。
そのためにAWSのサーバーレスプラットフォームであるLambdaが選択されたわけだが、その理由として「サーバーのプロビジョニングや管理が不要であること」と「コードの複雑化を避けたかったこと」を挙げた。
ここではアラートの処理のために複数のLambdaファンクションが必要となるが、その実行制御をどのように実装するのかという点について、SQSやEventBridge、Step Functionsを評価した結果、Step Functionsを選択したことが解説された。
この構成図では坂齊氏が開発したアラート処理の概要が解説されているが、アラートについて通知が必要かどうかを振り分けた後、誰にどのような文面でメールを送信するのかを処理するという中身が明らかになっている。
このスケジュールからわかるのは、AWSの基礎知識を2ヶ月で習得した後に現場業務の理解、設計に1ヶ月、開発に6ヶ月という時間の割り振りだ。それほど大がかりなシステムでもなく、実施対象となる組織への説明に苦労したというコメントを見れば、このシステム自身は坂齊氏の新人教育の一貫として業務理解から設計、開発、テスト、現場への導入までの一通りのプロセスを経験させるためのものだったように思える。
このまとめもAWSに特化した内容となっており、運用担当者にとってはAWS以外のシステムには応用できないこと、大量のアラートに対応するにはどうするべきか? というスケールアウトの発想が見られないことなどから、あくまでも新人教育の中で「作ってみた」というレベルだったことがわかる。
連載バックナンバー
Think ITメルマガ会員登録受付中
全文検索エンジンによるおすすめ記事
- CNDO2021、サーバーレスの勘所をサーバーワークスのエンジニアが紹介
- CODT2021、組織変革でスクラム開発を加速したKDDIのセッションを紹介
- CI/CD Conference 2023から、アルファドライブ/ニューズピックスのSREがAWS CDKを活用したCI/CD改善を解説
- クラウドネイティブの真髄であるサーバーレスがキーノートに登場
- サーバーレスな事例が次々登場―ServerlessConf Tokyo 2016レポート
- OpenStack Summit Sydneyに見るOpenStackの今そしてこれから
- 米Red HatがRHELの無償サブスクリプションを提供、米MSがWindows 10でコンテナをサポート、ほか
- Observability Conference 2022、利用者目線のオブザーバビリティ実装をドコモのSREが解説
- サーバレスアプリケーション運用フレームワーク「Serverless Framework 1.54」リリース
- OpenShift Commonsで知る継続的デリバリーのSpinnaker最新情報