CODT2021、NTT ComがOSアップデートに関する失敗談を紹介
Cloud Operator Days Tokyo 2021から、NTTコミュニケーションズ株式会社(以下、NTT Com)が発表した「エンタープライズ向けクラウドサービスにおける大規模・商用環境でのホストOSバージョンアップ」というセッションを紹介する。これはタイトル通り、NTT Comが世界中に展開するエンタープライズ向けのクラウドサービスであるEnterprise Cloud(現在ではSmart Data Platform、SDPFと改名)における仮想サーバーのホストOSをアップグレードした際の経験を解説する内容となっている。実際の内容から考えれば「運用苦労話」というカテゴリーで語られるべき失敗談とその原因の追及、そしていかにリカバリーを行ったかという経験を詳細に説明したものである。
セッションの動画:エンタープライズ向けクラウドサービスにおける大規模・商用環境でのホストOSバージョンアップ
セッションを担当したのはNTT Comのソフトウェアアーキテクトである佐野成氏だ。
クラウドサービスを運用する「辛み(つらみ)」
次のスライドでこのセッションの語られる内容が挙げられているが、ここでも「エンタープライズ向けクラウドサービスの辛さ」について記述されており、この時点で次に失敗談が来るであろうことは想像できる。
まずは対象となるクラウドサービスの紹介から始まった。世界中の13拠点に仮想マシンの総数として35,000台という規模のサービスであり、その中の仮想サーバーを提供するサービスが今回のバージョンアップの対象となる。ここではECLという名称からSDPFという現在の名称に変わったことが簡単に説明された。また提供するプラットフォームは、OpenStackをベースにしていることが解説された。
続いては仮想サーバーの中核となるコンピュートノードの紹介である。3つの世代のインテル製CPU(古い順にHaswell、Broadwell、Skylakeというコードネームで呼ばれる)を使ったサーバー40台のクラスター構成で36台がアクティブ、4台がホットスタンバイ状態となる。またホストOSもカノニカルのUbuntuとレッドハットのRHELを使った2種類が存在していることが解説された。
ホストOSの違いによってコンピュートノードを世代として定義し、それをアップグレードするというのが今回のセッションのトピックである。
CPv1はUbuntu 14.04とRHEL7.4を使用するサーバー、CPv2はUbuntu16.04とRHEL7.6を使うサーバーだ。
また仮想サーバーのプラットフォームとなるOpenStackについてもバージョン管理が行われており、OpenStackとコンピュートノードのホストOSを交互にアップデートしていくというスパイラルアップデートという方法を採用している。
そしてライブマイグレーションを使ってアップデートを行う仕組みを解説した。CPv1の上で稼働している仮想サーバーを別のCPv1のサーバーにマイグレーションした後で、元のCPv1のOSをCPv2にアップデート、その後でCPv1で稼働していた仮想サーバーを元のハードウェアにマイグレーションする方法を採用している。
連載バックナンバー
Think ITメルマガ会員登録受付中
全文検索エンジンによるおすすめ記事
- Nova最新動向:スケジューラ、セル、ライブマイグレーションの改善は継続、他のプロジェクトとの連携が課題に
- Hyper-Vのライブマイグレーションとその他の拡張機能
- Hyper-V 2.0で強化されたライブマイグレーション
- Nova最新動向:スコープを広げず安定性と機能性を追求
- OpenStack Days Tokyo開催、Ops Workshopにみる開発者以外を重視する姿勢とは
- さまざまな新機能を搭載したRHEV 3.5
- Novaの最新情報:Placement機能の発展と利用拡大、大規模な環境への適応
- Red Hat、「Red Hat Enterprise Linux OpenStack Platform 7」を発表
- OpenStackディストリビューションの比較検証と最新技術トレンド
- vNext Hyper-Vの注意すべき変更点 仮想マシンの運用