ページの先頭です

ページ内を移動するためのリンク
本文へ (c)

ここから本文です。

CIOたちが頭を悩ますクラウドのコスト管理と「Cloud Sprawl」

ライター:村上 丈文
国内外ITベンダーとの関係構築および商品・サービスの企画・開発とライフサイクル管理の責任部門をリード。

1998年3月横浜国立大学経済学部卒業。ユーザ系情報システム会社を経て、2001年5月 ネットワンシステムズ株式会社に入社。応用技術部にてネットワークエンジニアとして大手ベンダーやスタートアップの製品を担当した後、国際業界団体で標準化、コミュニティ活動に従事。その後、2012年4月より4年間Net One Systems USA, Inc.にて駐在員として新規商材の発掘、市場調査、顧客アテンドに従事。2016年4月より現職。2017年4月よりネットワンコネクト株式会社の経営会議メンバーを兼務。

CCIE R&S #8114
JNCIE-SP #125

目次

米国企業中心のマルチクラウドのユーザグループONUGですが、年に2回開催されるカンファレンスが今年10月もONUG Fall2021としてオンラインで開催されたため、今回も参加しました。そこで見えてきたトピックスやトレンドについて今回も4回にわけてご紹介します。

1.ONUGが目指す次世代のエンタープライズコンピューティング Enterprise Cloud2.0
2.CIOたちが頭を悩ますクラウドのコスト管理と「Cloud Sprawl」 ←本記事
3.Cloud Sprawl (クラウドの無秩序) をどう防ぐか? - ONUGのアプローチ
4.NetSecOps on Elastic Infrastructure - ネットワンの取り組み

クラウドのコスト管理とCloud Sprawl

クラウドにおいてはコスト削減といった事柄ばかりがハイライトされてきましたが、クラウドの活用を進めている企業にとっては、「どれだけ節約できるか」ではなく「クラウドのコストはわれわれのビジネス目的達成の上でどの部分に関連しているのか、そしてどのようにして知るのか」ということが最大の関心事項になっています。
その中でも参加者から課題として上がってきたCloud Sprawlというキーワードについての説明とONUGで共有された現状のベストプラクティスについてご紹介します。

画像:モジュール画像2

(Photo by Daoudi Aissa on Unsplash )

多くの企業がクラウドを既に利用しているのですが、コンピュータリソースは主に自社の中ではなく、クラウド企業側で起動されているため、サーバマシンなどの目視できる物理デバイスがなく、本当に使われているかどうかを利用部門が直感的に理解することは難しいです。また、水道やガス、電気はどんなに使ってもある程度の流量で止まりますが、クラウドのようにほぼ無尽蔵のリソースやネットワーク環境の上で動くものについては基本的に利用の上限はありません。更に、サービスの急激な人気上昇やセキュリティのアタック、乗っ取りなどの自社以外の行動がこの利用量を引き上げる可能性があります。

その上、料金体系は一つのクラウドだけでも従量課金、スポット、リザーブドなど多岐にわたるため、これら一連の要因を紐解き、適正な利用を行っているのかを把握するのは至難のわざです。しかし、これが分からないと差別化に貢献しているという位置付けのクラウドの利用を止めたりもできないので結果としてクラウド利用は無秩序に広がっていってしまいます。これがCloud Sprawlが問題視されている理由となります。
クラウド利用のメリットとクラウドスプロールによるナイトメアについて簡単に下図にまとめました。このことからもクラウドの利用に関してきちんと把握して、無秩序な広がりに歯止めをかけるクラウドガバナンスの重要性が再認識されていることが想像できると思います。

(図1:クラウド利用のメリットとクラウドスプロールによるナイトメア、筆者作成)

ONUGコミュニティにおいて共有されたベストプラクティス

ダイナミックに変動するクラウドのコストに目を光らせるというのは口で言う以上に大変です。特定の部署が今までのやり方で対処できるものではありません。ONUGのコミュニティで共有されていた取り組みは次のようなものになります。

  • 部門単体ではなく、部門連携して取り組みを進める
    クラウドに関するコスト構造は複雑なため自分たちの利用実感と利用量が一致しないことがままあります。事業部門側にチャージバックされた多額のクラウドコストに事業部門が納得できないこともよくあることのようです。したがって事業部門、IT部門、財務部門間における頻繁なコミュニケーションでこの意識のギャップを埋めていくことが必要です。いくつかの企業ではCCoE(Cloud Center of Excellence)というクラウド推進のグループを部門横断で組織して密なコミュニケーションを実現しています。
  • 人手ではなくツールを活用する
    ダイナミックに変化するクラウドの利用量や金額をそれぞれのクラウドサービス事業者から受け取って各部門にチャージバックすることは事業に関わるITコストを見える化する上で重要なことですが、人がマニュアルで実施するのに適した業務形態、業務量ではありません。クラウドコストの把握や分析、最適化のためのツールはクラウドプロバイダ自身やその他の事業者からもリリースされていますし、オープンソースでもそれらを収集しダッシュボード化できるものはあるので、それらを活用することが必要です。
    ただし、コスト最適化ツールの中には削減したコストに対する課金ではなく、ITコスト全体の数%に対して課金するというツールもあり、こういったツールについては投入の正当化が難しいとの声もありました。
  • SREチームの役割拡大
    SREはSite Reliability Engineeringの略であり、その名の通り主な役割の一つはサイトの信頼性とスケーラビリティを保つことにあります。一方でもう一つの大きな役割はDevOpsの概念を現実世界に実装するということで、アプリケーションの開発から運用のフィードバックループを作り、継続的に改善していくことが期待されています。この時SREはアプリケーションチームとインフラチームの仲立ちを行う位置付けになりますが、ダイナミックなクラウドのコスト管理を実現するためにSREに動いてもらったという話が複数の企業から出てきました。
    具体的にはアプリケーションチームが出してくるアプリケーションアーキテクチャのレビューに加わり、最適なクラウドサービスの選択についてアドバイスをしたり、クラウド利用の状況をパフォーマンスやセキュリティだけでなく変動するコストについてもモニタリングし、急激なコストの変動があった際には利用部門に対してアラートを出したり、より良いクラアドサービスの利用についてアドバイスをしたり、といった役割を期待されているようです。

Cloud SprawlによってIT予算が無秩序に消費されていくようになると当然信頼性やスケーラビリティは担保できないことや、アプリケーションとインフラアーキテクチャ双方を知る立場からSREにCloud Sprawl制御の役割を期待するというのは面白い考え方だと思いました。パブリッククラウドにおける投資対効果の最大化を目指し2019年に設立されたFinOps Foundationと合わせて注目していきたい流れです。

いずれにしても、ツールを活用して得られたデータをもとに複数部門が密にコミュニケーションを取ることがこの新しい課題への当面の対策であることは共通しています。
リモートワークが広がり、かつ問題がますます複雑になる中で、この密なコミュニケーションやコラボレーションをどのように実現していくかが、ますます重要なポイントになっていくように感じられました。

今回のONUGでは、上記以外にも各ワーキンググループの活動内容や技術的なトピックについて議論されています。今後の記事にて、今回発表されたその他の注目すべき取り組みや私たちネットワンシステムズのセッション内容について取り上げてご紹介いたします。

参考:

※本記事の内容は執筆者個人の見解であり、所属する組織の見解を代表するものではありません。

RECOMMEND