ページの先頭です

ページ内を移動するためのリンク
本文へ (c)

ここから本文です。

AI が実現する奇跡 AI Networking Summit 2024 NY から学ぶインフラの最新トレンド

ライター:猪子 亮
2019年ネットワンシステムズに新卒入社。

社内/外 向けサービス開発、事業部門の支援などを行っています。
主にWeb アプリケーションのフロントエンド、バックエンド開発(オンプレ/AWS)。

他には社内の自動化推進(Ansible)、業務改善活動、開発エンジニア育成などに取り組んでいます。

目次

はじめに

20241023日から24日にかけてAI Networking Summit がニューヨークで開催され、企業AI 分野のトップリーダーやサプライヤーなど45社がスポンサーとなり、1,000名以上が参加しました。
昨年度まではONUG Fall 202xといったタイトルでしたが、今年のイベントからはAI というキーワードが加えられ、AI Networking Summit となりました。
また、2日間にわたるイベントでは、60人の専門家による講演、40以上のAIソリューションのデモンストレーション、68のパネルセッション、そして9つの基調講演が開催され、ネットワーキングを通して様々な意見交換が行われました。

今回のイベントでは以下のトピックがテーマとして挙げられており、これらを通してONUG の共同創設者でありAI Networking Summitの共同議長であるNick Lippis氏は、「今年のAI Networking Summitの圧倒的な成功は、AIがビジネスを変革し、AI が実現する奇跡を可能にする重要な役割を担っていることの証です。このサミットは、AIによってどのようにビジネスが変わり、次のAI技術進展の時代において企業が価値を創造する方法を再定義するための基盤を築く場となっています。」と述べています。

KEY AI NETWORKING SUMMIT TOPICS

  • AI Networking
  • AI Infrastructure
  • AI Automate
  • AI Security
  • Plus

本記事では、AI Networking Summit で議論された内容に基づき、AI がネットワークインフラ、そして企業に与える影響についての最新動向を紹介します。生成AIの導入がどのようにネットワークインフラを変革しているのか、企業が今後注目すべき技術的課題やビジネス戦略のヒントになる情報をエンジニアや管理層向けに解説し、これからの時代におけるインフラの在り方について考察します。

AIとデータセンターのモダナイゼーション

Day1 午前中の基調講演である AI and Data Center Modernization: How Cisco is Unleashing the Power of Innovation では、AIの導入はデータセンターインフラの設計に多大な影響を与えており、特に注目すべきは以下2つの課題であると述べられていました。

拡張性の課題

  • AIの導入により、ネットワーク帯域幅の需要は劇的に増加している
  • 既存のデータセンターインフラでは、数十万から数百万のGPUクラスタが生成するデータトラフィックに追いつけず、ネットワークのボトルネックが問題となることが多くなっている
  • この課題に対応するために、スケールアップやスケールアウトを通じてネットワーク設計を見直す必要がある

電力問題

  • AI 専用データセンターには膨大な数のGPUが使用され、その結果電力消費が急増する
  • これに対処するためには、電力供給の効率化やインフラのパフォーマンス向上が必要
  • 具体的には、DPU(データプロセッシングユニット) の導入などが有効な手段と成り得る
  • データセンターの電力管理は今後もますます重要な課題となり、これをどのように最適化するかが鍵となる

生成AI の学習フェーズにおける大量のGPU リソースによる消費電力の問題やトラフィック増加の話は以前からよく耳にする印象ですが、データセンターのネットワーク設計にまで影響を与えていることには驚きました。
また、別の4人の専門家によるディスカッション形式のセッションThe New Data Center Design- Convergence of HPC, AI & and Non-AI Infrastructure では、以下の点からユースケース毎に求められるインフラが異なる点が議論されていました。

  • 多くの企業にとって推論とモデルのファインチューニングAI ワークロードの大部分を占めると考えられる
  • 特に中小規模の企業において、基盤モデルの新規開発よりも既存モデルのファインチューニングや特定タスクへの最適化が主流である
  • 例えば推論処理の多いワークロードであれば、特定のAI NIC を利用して通信効率を高める事が求められ、顧客向けのチャットボットなどのアプリケーションであればクラウド上でスケーラブルに展開することが求められる

検証フェーズやプロトタイプではクラウドを利用し効率的に検証、開発を行う一方、個人情報や企業における長年の知財を扱うなど、機密性の高いユースケースの本番稼働ではオンプレミスでの稼働がセキュリティ上望ましいとされており、ユースケース毎に最適なインフラ設計が求められていることが分かります。

生成AI によるネットワークの変革

The Impact of Adopting GenAI on Existing Network Capacities and Topologies: Proactive Steps for Network Practitioners のセッションでは、生成AI導入によるネットワークインフラへの影響が議論されており、特に低遅延のネットワーク構築と規格の選択が重要だと述べられていました。

EthernetとInfiniBand
AI インフラでは大量のデータが高速でやり取りされる必要があるため、ネットワークの遅延はシステム全体の利便性に直結します。
RDMA(Remote Direct Memory Access) やInfiniBandといった技術が、この低遅延通信を可能にし、AI ワークロードにおいて重要な役割を担っているとされます。
生成AIの導入にあたりInfiniBand を選ばれるのはその低遅延と高帯域幅によるものです。しかし、コストと運用の複雑さが課題として挙げられ、Ethernet を利用する方向にシフトしていく企業も増えているようです。

Ethernet は運用のしやすさや既存技術との互換性に優れており、特に低TCO やスケーラビリティ、運用負担を考慮するとEthernet が選ばれる場面も少なくないようです。
Linux FoundationUltra Ethernet Consortium (UEC) を設立していることからも依然としてEthernet の可能性がうかがえます。
また、業界初のUEC 準拠のNIC としてAMD から発表されたPollara 400 も紹介されており、UEC 対応スイッチの登場も待たれます。

企業におけるAI インフラの導入とROI

AIインフラの導入は重要な転換期を迎えています。ここでは、基調講演で触れられていた医療分野のがん研究におけるAIの活用と、生成AIのROI に関する議論を取り上げ、AIの効果が現れている分野と課題の残る分野について紹介します。

生成AI による革新: 医療分野(がん研究)

今回のAI Networking Summit で最も注目された基調講演の1つがMemorial Sloan Kettering Cancer Center(略称MSKNYC にあるがん治療センター) Tsvi Gal氏の講演です。
MSK では膨大な患者データを解析することで、遺伝子配列の解析や免疫療法の開発を進めており、例えば、がん治療の重要なステップである「ゲノム配列解析」では、1.6PB(ペタバイト=1,024テラバイト) に及ぶ膨大なデータをAI が迅速に解析し、がんに関連する遺伝子変異を特定したと紹介されていました。
また、AI による「デジタルツイン」の導入により、電子的にシミュレーションされたデジタルマウス(仮想マウス) を用いた実験も行っており、実験用マウスの犠牲を大幅に削減しつつ、新しい治療法や薬剤の効果を効率的に検証できるようになったことが紹介されていました。

今後5年間で、AI 技術を駆使したがん治療の進展はさらなる飛躍が期待されており、MSKでは、以下の目標を掲げているようです。

  1. 慢性疾患としてのがんの管理
    一部のがん種では、AIを活用した治療により「急性疾患」から「慢性疾患」へと転換することを目指している。具体的には、がんを完全に消失させるのではなく、患者の生活の質を維持しつつ長期間管理可能な状態を目指す。
  2. がん予防ワクチンの開発
    一部のがん種に対し、mRNA 技術を応用した予防ワクチンの研究を進めている。この技術では、免疫システムががん細胞を再び認識して攻撃する能力を持つようになり、この成果が実現すれば、一部のがんに対する「免疫」を人類にもたらす可能性がある。
  3. 超早期がんの発見と治療の簡易化
    超高解像度の電子顕微鏡(ナノスケールレベル) AIで解析することで、微小ながんを早期に発見し、迅速な治療が可能になる。最終的には、特定のがんに対し「薬を数ヶ月服用するだけで完治する」といった未来が実現されるかもしれない。

実績として2023年に発表された直腸がん患者への免疫療法の試験では、100%の患者が完全寛解(がんの完全消失) を達成しており、これはAIと遺伝子技術を駆使した研究が持つ可能性を如実に示していると言えるのではないでしょうか。
また、これらの実績や今後の期待から、AIの医療分野での社会的意義と、AI 普及(民主化) に向けたAI インフラの重要性も強調されていました。

ROI 評価の現状

MSK Tsvi Gal氏はROI に関してはこう述べています。「AIの導入はがんの診断と治療の進展に多大な貢献をしています。AIにより、データ収集や分析の多くの部分が自動化され、研究者がコア業務である研究活動に集中できるようになりました。このような効率化により、医療の質の向上と生産性の増加という形でROIが向上しています。」
MSKは非営利組織であり、純粋な金銭的利益よりも、AI導入による科学的進歩や人命救助が大きな成果と考えられているようです。

一方、金融や製造業など他の分野では、AI ROI に対する考え方は依然として模索段階にあるようです。生成AIの導入については、特にチャットボットやカスタマーサポートといった比較的狭い用途が多く、企業がその効果をどう測定するかが課題となっています。

生成AIの本質的な可能性を十分に引き出すためには、データの整備や、具体的なユースケースの定義が重要です。
このような状況を踏まえ、特にB2C 領域での具体的な成果の測定が難しいことが指摘されています。
企業によっては、実験的な段階からROIを測定し、導入の進捗とともに投資対効果を明確にする取り組みが求められています。

企業がAI インフラ導入で成功するためには

The GenAI Gold Rush Where’s the ROI では、多くの企業がAI 導入において失敗する要因は、技術ありきのアプローチに陥り、具体的なビジネスゴールやユースケースが曖昧である点であると議論されていました。
例えば「サポートコストを25%削減する」、「エンジニア対応工数を30%削減する」、「顧客対応品質を30%向上させる」といった明確な目標を立て、その効果を測定することの重要性が指摘されています。

その他にはデータの品質やセキュリティの確保がROI を大きく左右するため、単なる技術導入ではなく各ユースケースにおけるビジネス価値を最大化するために戦略的にプロジェクトを進めることの重要性が強調されていました。

まとめ

AI の導入がデータセンター、ネットワーク、そして企業のビジネスモデルに与える影響は非常に大きく、今後さらに進化していくことが期待されています。
弊社ではデジタルイノベーションを実現する取り組みとして、 netone Co-Creation を提供し、お客様と共に新たな価値を創造していくことにもチャレンジしています。AIを活用したアイデアも例外ではありません。

これらの情報をもとに、次の一歩を踏み出す際には、AIを使ってどのように自社のインフラやサービスを改善し、価値を創造するかについて議論する際の参考になれば幸いです。

続編として、AI Networking Summit 2024 NY のブレークアウトセッション(Triple-T) で弊社が発表した未来のIT 運用におけるサイドキックAI のデモについての記事を公開予定です。
是非そちらもご覧ください。

※本記事の内容は執筆者個人の見解であり、所属する組織の見解を代表するものではありません。

RECOMMEND