クラウド運用における「最適化」「人的コスト」の課題を解決するNECのクラウドコスト最適化ソリューションとは
はじめに
FinOpsのプラクティスを取り入れ、クラウドのコスト管理を実現する上で、以下の3つの課題がある。
- 可視化における課題
- 最適化における課題
- 人的コストにおける課題
前回は、そのうち「可視化における課題」について、弊社(NECソリューションイノベータ株式会社)が提供する「NECクラウドコスト最適化ソリューション」を用いた解決策について紹介した。
今回は「最適化における課題」「人的コストにおける課題」について、NECクラウドコスト最適化ソリューションが提供する解決策を紹介する。
※NECクラウドコスト最適化ソリューションの概要については、前回の記事を参照してほしい。
クラウドコストの最適化
最適化における課題
第1回のクラウド管理をする際の課題で触れたように、ユーザー企業がマルチクラウド、マルチアカウントにてクラウドを活用するケースが珍しくなくなってきており、個々のクラウドベンダやサービスの特性を考慮した最適化を行う必要がある。
また、クラウドの利用拡大に伴って管理対象も増加を続けており、人手ですべてを確認し、最適化を適用していくことは現実的ではなくなっている。
NECクラウドコスト最適化ソリューションでは、クラウド環境において利用費用の大部分を占めることが多い、仮想マシンやコンテナ環境に対して効率的に最適化を実現するための機能を提供している。
前回で管理対象を可視化する機能を紹介したが、今回は可視化された管理対象を効率的に最適化するための機能について紹介する。
インスタンスサイズの最適化
実際にクラウドの利用状況を可視化して浪費コストが見えてきたら、コスト削減のための最適化を行うことになる。しかし、クラウド上で利用しているインスタンスの数が多くなれば(監視、最適化の対象が多くなれば)、利用状況の可視化、最適化機会の確認、最適化の実行のサイクルを回すためにかかる作業コスト(人的コスト含む)が多くかかり、サイクルを回すのが困難になる。
また、実際にどれくらいの浪費コストが発生しているかの確認も難しく、目についた対象から最適化を実施してしまうことで、本来対処すべき浪費コストの大きい対象ではなく、コストメリットの小さい、浪費の少ないインスタンスに対して最適化を実施し、コスト削減が思ったように進まない…というケースも発生しうる。
CloudNatixではこれらの課題を解決するため、最適化を実行した際にコスト削減効果の高いものから効率的に最適化が行えるように支援する機能を提供している。
これまで、クラウド上で利用しているリソースの最適化を行う場合、ベテランエンジニアが実際に利用しているインスタンスの稼働状況を確認し、インスタンスサイズを変更すべきか、変更する場合はどのくらいのサイズが適切か、といったことを確認・検証して適用可否を判断した上で実行する必要があった。
CloudNatixではこのベテランエンジニアにしかできなかった最適構成を、収集したインスタンスの稼働状況の情報をもとに、上図のインサイト画面にてAIが提案をしてくれる。その結果、ベテランエンジニアでなくともAIの提案に従って最適化を行うことが可能になり、「提案の適用可否」に注力して最適化を推進できる。
また、AIの提案内容は実際にどのサイズのインスタンスに変更すれば良いか、といった内容だけではなく、変更することでどの程度のコストメリットがあるかも額面で提示してくれる。
これまでコストの削減効果が定量的に測れず、とりあえず目についたものから逐次対応を行っていたようなケースであれば、CloudNatixを使うことで、特にコストの削減効果の高いものから優先的に、かつ効果的に対策することが容易になる。
これらの対応が他の要員でもできるようになることでクラウド管理にかける人的コストを軽減し、よりビジネス価値の高い作業に集中させることができるようになる点も、CloudNatixが提供する価値である。
このインサイト画面は、前回紹介した「組織構造」ごとに見ることもできる。その結果、組織単位でコストの最適化が必要かどうかの気づきを得て、実際にコスト最適化のためのアクションを効率的に行うことが可能になる。
インスタンス未使用時間の停止自動化
インスタンスサイズの最適化以外によくある浪費のケースとして、例えば開発環境やテスト環境などで一時的に作成/利用したが停止・削除が忘れられて起動したまま放置されているものや、使用するのは日中のみ(定時間内の業務用)で夜間は使わないマシンが停止されず、夜間も起動しっぱなしになっているケースなどがある。
こうしたマシンの停止漏れも、管理対象が多くなると人手でチェックし、対処を行うのも現実的ではない。CloudNatixでは、これらのマシンに対してスケジュールを設定してマシンの起動・停止を簡単に自動化し、人手を介さず停止漏れによる浪費コストを防ぐことができる。
インスタンス購入の最適化(FinOps Copilot)
インスタンスサイズの最適化、自動停止によるコスト最適化について触れたが、続いて購入の最適化支援機能(AWS)について紹介しよう。
コストを最適化する上では、インスタンスサイズの最適化や不要な仮想マシンの停止、スケジューリングを行った後に、Savings Plans(SP)やReserved Instance(RI)といった割引率の高い料金モデルを選択・購入することで、よりコスト効率を高めることができる。
CloudNatixではどのサイズのインスタンスをどの程度購入すれば良いか、利用状況(※現在はCUIでの機能提供。下図のイメージは開発中のもの)を元に提案する機能を提供している。
例えば、本機能を利用することで以下のようなオペレーションが可能になる。
- 現在のSP/RIの適用率や利用率を画面上から確認し、最適化の余地がないかの知見を得る
- 利用率が低い場合は購入しているSP/RIが効果的に利用されていないため、SP/RIの購入量を見直したり、利用率の改善に取り組む
- 利用率が高く適用率が低い場合には、追加でのSP/RIの購入を検討する
- 最適化の余地がある際には、画面上から購入のrecommendationを確認し、必要に応じて購入予測のシミュレーションを行う
- SP/RIを購入する
SP/RIの購入に際しては、適用率のみを考慮すると本来は適用が不要な(オンデマンドでの使用が適切なもの、停止しておくべき)インスタンスも対象に含めてしまい、浪費コストが発生してしまうケースがある。
CloudNatixでは、前述の可視化機能による不要なインスタンスの特定、インスタンスのサイズの最適化、不要なインスタンスの停止といった機能と組み合わせることで、仮想マシンの無駄を取り除いた後に効率的に適切な量のSP/RIの購入を検討できるようになる。
運用高度化の支援
ここまで、コストの可視化、最適化といったポイントで機能を紹介してきたが、CloudNatixはKubernetesを利用しているユーザー向けに開発を効率化する機能も提供している。
マルチクラウド環境においてKubernetesを利用している場合、アクセスするクラウド毎に踏み台となるサーバーを用意し、踏み台を経由して環境にアクセスを行うのが一般的だ。CloudNatixではこうした環境下においても、各Kubernetes環境に統一的で、かつセキュアにアクセスする機能を提供している。CloudNatixを利用することで、踏み台のインフラ管理が不要になり、踏み台となるインフラ自体の利用費用削減だけでなく、運用にかかる負担の軽減やセキュリティ対策にもつながる。
また、Kubernetesにアクセスしてのログの取得やコンソール操作なども、CloudNatixの画面から簡単に実現できる。コンテナ環境へのアクセスは知識や経験が必要なケースがあるが、この機能を用いることで開発者以外でも画面からのログ採取などを容易に行えるようになるため、オペレータに必要なスキルのハードルを下げることが可能だ。
そのほか、運用の負荷になるKubernetesクラスタのアップグレードを支援する機能なども提供しており、これらを活用することで運用に必要な負荷、スキルのハードルを下げ、開発者が開発に集中できる環境を整えることができる。
人的コストにおける課題について
第1回で触れたように、クラウド利用の最適化を継続的に実践していくためには、専門的な知見、スキルを持ったメンバーの人的作業が多くなる。
CloudNatixでは、これまで紹介してきたいずれの機能(可視化、最適化、運用高度化)においても、管理、運用に必要な知識、経験を(例えばAIによる支援などにより)補うことができる。その結果、高スキルの人材でなくとも最適化に向けた取り組み(可視化し、最適化の機会を確認し、実践するサイクルを回す)ができるようになり、「人的コスト」を下げる(高スキル者への依存度を下げる)環境をユーザー企業に提供する。
加えて、NECクラウドコスト最適化ソリューションでは、CloudNatixでは手の届かない様々なサポートも提供している。例えば、ユーザー企業の運用に合わせたダッシュボードのカスタマイズや発生している浪費コストの傾向を踏まえたレポートの作成、クラウドコストの最適化に関するノウハウやFinOpsに関する最新情報の共有などだ。NECクラウドコスト最適化ソリューションでは、こうした高スキル者により人的サポートを行うことで、ユーザー企業の運用負荷を下げる取り組み行っている。
おわりに
CloudNatixは、コスト最適化の課題である「可視化」「効率的、継続的な最適化の実行」「人的コストの課題解決」を強力に支援する。クラウドの利用状況には波があり、繁忙期、閑散期、その他利用者のビジネスに合わせてうまく、かつ継続的に最適な利用状況を維持していく必要がある。
ビジネス状況の変化(ビジネスの拡大、クラウドの利用拡大)に合わせて効率的にかつスピーディにリソースの管理を行うには、オンプレミスのような管理手法(リソース数が決まっており、変動が少ない環境での人手をかけて行う管理手法)を改めるとともに、CloudNatixのような管理手法を強力に支援するツールをうまく活用していく必要もある。
NECソリューションイノベータでは、CloudNatixの活用に加え、社内のクラウドエキスパートの知見を活かした効率的なコスト最適化の提案・実施など、ユーザー企業のシステム特性を踏まえた以下のようなサポートを実施している。
- ソリューション導入前のユーザーのクラウド利用状況やコスト状況から浪費コストの簡易診断
- ユーザー企業の課題ヒアリングとヒアリング結果に基づいた最適化戦略の提案
- CloudNatixの機能アップデートの紹介と、ユーザーのシステムに合わせた活用方法の提案や導入サポート
- 提案に基づいた改善の伴走支援
*NECクラウドコスト最適化ソリューションでは、実際にソリューションを利用し、効果を体験できる無料のトライアルも提供しています。実際の導入事例など含め、以下の公式サイトにて情報を展開しているので、ぜひアクセスいただければと思います。
「NECクラウドコスト最適化ソリューション」
https://www.nec-solutioninnovators.co.jp/sl/cloud-cost-optimizer/index.html
CloudNatix Inc.
https://www.cloudnatix.com/
連載バックナンバー
Think ITメルマガ会員登録受付中
全文検索エンジンによるおすすめ記事
- クラウドのコスト最適化を推進する“3要素” ─NECが見据えるFinOpsへの到達法とは
- クラウド運用における「可視化」の課題を解決するNECのクラウドコスト最適化ソリューションとは
- クラウド利用の最大の課題は「コスト管理」
- Podのリソース割り当ての推奨値を提案するKRR(Kubernetes Resource Recommender)
- CloudNative Days Spring 2021開催。CNCFのCTOが語るクラウドネイティブの近未来
- FinOps Foundation最大のグローバルイベント「FinOps X 2024」開催、最新の技術動向や事例を幅広く紹介
- CNCFが2022年の活動と成果を振り返る「CNCF Annual Report 2022」を公開
- FinOps Foundationのエグゼクティブディレクターが来日、FinOpsの要点を解説
- コンテナ開発へのDevSecOpsの適用
- CNCFで開発の進むFinOps関連ツールの動向紹介