企業ネットワークの信頼性・可用性を高めるには

ビジネス推進本部 応用技術部
エンタープライズSDNチーム
中村喜之

 昨今のファイル共有、メール基盤などへのクラウドサービス利用の促進だけでなく、政府の働き方改革の促進から、リモートアクセスVDIでのテレワークなどにより、「ネットワークに繋がっていること」が業務の前提となってきています。

 また、インターネットを経由したサービスを提供している企業では、ネットワーク障害が即損失に直結するケースも多く見られています。

 2016年は複数企業で、ネットワーク障害が大規模なサービス中断につながる事故が発生するなど、企業ネットワークの高信頼化・可用性向上は大きな課題となっています。

 本稿では、ネットワークの高信頼化・高可用性の維持を目的としたIn-band監視と運用のコード化・自動化を取り上げ、ネットワーク構成と運用面からのアプローチをご紹介します。

In-band監視の活用

 現在、ネットワーク機器の稼働監視は、機器から出力されるSyslogメッセージやSNMPによるカウンタ値の参照等を利用した、機器本体からの情報を主体としたものが基本となっています。しかしながら、機器自らが「壊れているか」を検出することは技術上非常に難しく、一部で検出できない障害発生パターンや部位があることも現実です。

 高信頼性が要求されるキャリアネットワークではこの問題を解決するため、データを転送する「In-band(ネットワーク内部)」で「実際にデータを転送して」動作を確認することに活用可能なプロトコル・機能の利用が進んでいます。

Layer2向け
・Ethernet OAM
・Single Link LACP

Layer3向け
・BFD(Bidrectional Fowording Detection)

その他
・IP-SLA (Cisco社独自機能)

 In-band側を用いて監視を行うことは、管理者が手動で行うICMP(Ping)など古くから実装されていますが、上記のような専用の仕組みを用いることで、実サービスに近い部位を継続的に監視可能となっています。また、製品や機能によっては冗長機能と連携した高速な切り替えも可能です。

picture2
図1. 従来の機器監視とIn-band監視の違い

 このようなプロトコル・機能は機器CPUへの負担が高いことなどの理由にから、主にキャリア向けのハイエンド機器にしか実装されていませんでしたが、近年では、一部の企業向けネットワーク製品でも実装が進んできています。

 また、ネットワーク機器本体に頼らず、機器に外付けするタイプの装置も開発されており、「実際にデータを転送して」ネットワークを監視することが企業向けネットワークでも導入が見込める状況となってきています。

picture1
図2. 外付け型OAM機器の適用例

運用のコード化・自動化

 一方で、企業ネットワークでは障害と思われる事象を機器から出力されたログやユーザーの申告から発見した際、運用者が行ういわゆる一次対処作業は手動で行われていることが多いのではないでしょうか。

 このような手動オペレーションは応用性や自由度が高い半面、次のような問題点も抱えています。

・障害事象発生時の対処が遅くなる
・作業ミスによる二次被害の発生やログ取得不足
・作業内容や品質が属人化してしまう

 そこで、現在注目されているのが運用のコード化・自動化です。サーバー・プラットフォームにおける構成管理ではツールの開発や利用が大きく進展しており、Chef、Puppet、Ansible等の構成管理ソフトウェアの活用が進んでいます。このような技術をネットワークの運用にも適用する試みが現在盛んになってきています。

たとえば、BrocadeからリリースされているBrocade Workflow Composerでは
・どのような時に作業を行うのか(トリガー)
・どんな作業を行うのか(ワークフロー)
・何に対して行うのか(アクション)
をシステム側が解釈可能なYAML等で表すことで作業手順のコード化・自動化をすることが出来るようになっています。

picture3
図3. Brocade Workflow Composerによる作業手順コードの作成画面

 このようなツールを用いることで、障害発生時の対応迅速化やミスの低減をはじめ、運用の自動化推進につながることが期待されています。

まとめ

 今回はIn-band監視の拡充や運用コード化・自動化ツールを用いてのネットワークの信頼性・可用性向上のアプローチについて紹介させていただきました。
 弊社では従来の監視に加え、上記で提案したIn-band監視や運用自動化システムを連携させたネットワーク運用自動化基盤の検討を行っています。

picture4
図4. サイレント障害検知・自動復旧デモの構成

 みなさまのネットワークでも「いつもつながるネットワーク」のさらなる充実を目指して、監視の拡充や自動化を検討してみてはいかがでしょうか。

執筆者プロフィール

中村 喜之

ネットワンシステムズ株式会社 ビジネス推進本部
応用技術部 エンタープライズSDNチーム 所属

キャンパス、キャリアネットワークの提案および導入を支援する業務を中心に、新製品の評価検証・拡販業務に従事。

現在はキャリアおよびデータセンター向けのスイッチ製品に注力している

イベント/レポート

pagetop