ページの先頭です

ページ内を移動するためのリンク
本文へ (c)

ここから本文です。

マルチクラウドネットワーク監視のベストプラクティス - 使える「クラウド接続サービスの通知」とは

マルチクラウドやハイブリッドクラウド環境でのネットワーク監視において、障害箇所の特定に時間がかかっていませんか?

本記事では、ブラックボックスになりがちな「クラウド接続サービス」の監視を効率化し、事業者からのBGP通知を活用して運用負荷を下げるベストプラクティスを解説します。

ライター:野口 拓海
自社サービスの企画・開発業務を担当
技術とビジネスの両面からお客様にとって価値あるサービスの創出に取り組んでおります。
業務を通じて得た技術的な気づきや、ビジネス応用について考察・ご共有してまいります。

目次

クラウド時代のネットワーク監視の憂鬱

昨今、AWS、Azure、Google Cloudなどを適材適所で使い分けるマルチクラウドや、オンプレミス環境と組み合わせるハイブリッドクラウドが一般的となり、レイヤー3(L3)のクラウド接続サービスが広く活用されています。

それにともない私たちを悩ませているのが、複雑化したネットワークの「監視」です。
「遅い・繋がらない」というとき、オンプレミス・閉域網・クラウドのどこが原因か即座に特定できているでしょうか。
切り分けに時間がかかり、調査中としか答えられない時間は管理者にとって最大の憂鬱ではないでしょうか。

今回は、クラウド時代のネットワーク監視に対する頑張りすぎない現実的なアプローチをご紹介いたします。

クラウド接続における3つの構成要素とブラックボックス

ハイブリッドマルチクラウド環境をシンプルに分解すると、大きく3つの要素に分かれます。

図1 クラウド接続の3つの構成要素
  • オンプレミス(自社環境)
  • クラウド接続サービス(L3閉域接続)
  • クラウド(マルチクラウド環境)

このようなネットワークにおいて正常に通信できているかを確かめるには物理ポートや機器の死活監視だけでは不十分であり、プロトコルの監視が重要になります。
クラウド接続には一般的にBGPが利用されることが多いため、状態の監視にはネットワーク全体を通したBGP状態の確認が最適といえます。

しかし、オンプレミスとクラウドをつなぐ中間のクラウド接続サービスは、利用者から見ると基本的にブラックボックスです。

図2 クラウド接続のブラックボックス

  • オンプレミス: 自社のルーターのためBGP状態が見える
  • クラウド接続サービス: ブラックボックス ←ここが問題
  • クラウド: 各種メトリクスでBGP状態が見える

パケットが通っているかはpingなどの疎通確認で分かりますが、クラウド接続サービス内で何が起きているかをユーザー側から直接確認することは基本的にはできません。
この見えない区間がある影響で、いざ障害が起きたときに「ウチ(オンプレ)は悪くない、クラウドのステータスも正常。じゃあ接続サービス?」という推測しかできず、クラウド接続サービス側に確認が取れるまで原因が確定しない…といった憂鬱な時間が発生します。

理想的な監視の落とし穴

こういう場合どう考えるでしょうか。真面目なエンジニアほど、「自力で何とかしよう、見えないならば見える両端から推測すればいい」と考えがちです。
オンプレミス側のルーターログとクラウド側のメトリクスを統合し、相互に突き合わせる。この手法は、理想的な監視として正しいアプローチに見えます。

しかし、これを完璧に実装しようとすると、構築・維持コストが跳ね上がります。また、論理的なセッションは上がっているのに通信だけが通らないサイレント障害や非対称ルーティングのような複雑な事象までは、両端の監視だけでは見抜けないこともあります。

監視はクラウド接続サービスの通知機能に頼る

そこでおすすめしたいのが、クラウド接続サービス事業者が提供している「障害通知」や「BGP状態通知」の質を重点的に評価する、つまり情報提供力が優れたサービスを検討することです。
自力で検知する仕組みを作り込むより、サービス側で切れたら事業者が即座に教えてくれるサービスを選ぶ方が、運用は圧倒的に楽になります。

メリットとしては以下が考えられます。

  • 切り分けの短縮: 通知が来ればサービス障害で確定、来なければ自社かクラウドの設定と判断できます。
  • 詳細情報の獲得: 事業者側の通知が充実していると、「メンテナンスによる切断」「BGPの経路数の変化」など、原因に踏み込んだ情報が得られる場合があります。

【まとめ】運用リソースを守るためのサービス選定

クラウド時代のネットワーク監視の要は「信頼できる情報源」の確保です。全部自分でと考えるのではなく、事業者の通知に任せると割り切ることで、頑張りすぎない現実的なネットワーク監視が実現できるのではないでしょうか。

弊社が提供するマルチクラウド閉域接続サービス「クラウドHUB」では、運用者の安心を重視し、BGPの状態変化を通知する機能を標準装備しています。今どこで何が起きたのかが分かれば、障害対応の心理的負担は大きく変わります。
クラウド接続サービスの選定の際は、ぜひ監視通知の質にも注目してみてください。

関連サービス

マルチクラウド閉域接続サービス「クラウドHUB」
BGP状態の通知機能を標準装備。ブラックボックスになりがちなサービス状態を可視化、運用負荷を低減します。

※本記事の内容は執筆者個人の見解であり、所属する組織の見解を代表するものではありません。

RECOMMEND