キャリアエッジルータの最新ラインカードとその特徴(後半)

ビジネス推進本部 第1応用技術部
コアネットワークチーム
渡部 満幸

先月お伝えしたラインカード情報の続編です。
前回の最後で、使い方による性能差について紹介したいとお伝えしましたが、実際のところあまり詳しくお伝えできそうにありません。
ご期待にそえない可能性もありますがどうぞ最後までご覧になってください。

連載インデックス

免責事項

本コラムでは各メーカが公表した2015年6月現在のデータ、および弊社内での独自の試験の結果を一部使用しています。
内容の性格上、詳しくお伝えできない部分があります。
また、実運用時の挙動及びパフォーマンスを保証するものではありません。
参考情報としてご利用ください。

メーカ公証値との差異がある場合、正確性の観点からメーカ公証値をご利用ください。

はじめに

前回の記事では、Cisco、Juniper、Alcatel-Lucent、3社の最新ラインカードに搭載される転送チップ(NPU)の性能について列挙しました。
性能を数字だけで比較すると、大きな違いはありません。
何か違いはないのか?・・・実は結構あります。
しかし、公のInternet上で私がお話しできる範囲は非常に狭く、皆様のご期待に沿う後半コラムになっていない可能性がありますので予めご了承ください。

今回は、それぞれのNPUの転送性能とスケーラビリティに関する特徴をお伝えします。

Cisco ASR 9000シリーズ

第1世代Tridentでは、Scale Profileを変更することでLayer 2機能特化、Layer3機能特化といったFIB容量の割り当て方式の変更が可能でした。
これは例えば、Cisco7600等に見られるTCAMの割り当て配分を変更することでMACテーブル容量を減らし、IPテーブル容量を増やす等といったものに似ています。
ところが、第2世代のTyphoon NPUではScale Profileの考え方は削除され、割り当て配分は固定されています。
第3世代Tomahawkについては、現状具体的な情報が出てきておらず、配分は可変なのか固定なのかわかっていません。
しかし、Cisco社のプレゼン資料に記載されている(Future)の文字を見ると、FCS(First Customer Shipment:製品初期出荷)時点では固定式で、将来何らかの形で可変式をサポートする可能性があります。
その場合、おそらくIPテーブル10Mまで容量を増やすと、その分MACテーブル容量は512kまで減る、といった具合になるのでしょう。

TyphoonのFIB配分が固定である理由は定かではありませんが、現在のところデータシートの数字を信じてそこまで出来る、と判断するのが容易です。
つまりIPv4 4M経路、MACテーブル2M、これはACLを数千行書いても、QoSを数百パターン書いても、それらの設定とは無関係に収容可能なFIB容量なのです。

しかし、逆の観点で見れば、Typhoon搭載のラインカードに限って言えばFIBの配分を変更できないため例えば「IPテーブルだけ容量があればよい」といった使い方の場合にMACテーブルの配分を削ってIPテーブルにまわすといった使い方ができないとも言えます。

Juniper MXシリーズ

Trio及びCassisベースラインカードのPFEでは、利用可能なフォワーディングメモリをいくつかの機能ブロックに分割して利用しています。
Juniper Networks TechLibrary

Next-hop(FIB)メモリとFirewall(Filter)メモリは、別々に固定の容量が割り当てられており、それに追加割り当て可能なexpansion memoryと呼ばれる共有メモリを持っています。

expansion memoryの役割は、Next-hopやFirewallメモリの専用領域が一杯になった場合に、溢れた分を格納する外部バッファです。外部といってもPFEの一部です。
例えば、expansion memoryがFirewallエントリで埋め尽くされてしまった場合、Next-hopメモリは専用領域以上の情報を格納できない可能性があります。

つまり、使い方によっては期待するスケーラビリティ(NG-TrioであればIPv4 10M等)を発揮しない可能性があるため、データシートの数字だけでは実運用上の具体的な容量について見立てが難しいということを意味します。

しかし、これは別の視点からテーブル容量を必要な機能に対して柔軟に割り当て可能な仕組みであり、用途にハマれば他社では追随できない圧倒的なスケーラビリティを発揮すると言えます。

尚、筆者の個人的な経験によると、1台のエッジルータがIPv4 10M経路を収容しなければならない、といった超大規模収容は、よほど高密度なVPN超オーバーサブスクリプション収容でもしない限り、現実的にあり得えないと考えられます。
データセンタに導入するゲートウェイ等の利用方法においては、Firewall FilterとMAC(Next-hopメモリ)の容量が心配といえば心配です。

Alcatel-Lucent SRシリーズ

最後にFP3ラインカードについて、実はこの製品についてここでお話しできる内容がほとんどありません。
それでは申し訳ありませんので、言い訳として、強いて挙げるとすれば、FP3はP3-Q3-T3の3つのチップを必ず通過してパケットが転送されるという構造上の特徴です。
これは、QoSの設定を行わなければQ3をバイパスしたほうが適切であるようなトラフィックも必ずQ3を通過する(ように考えられる)ため、構造として無駄があるように見えます。

しかし、ここまででお話ししていませんでしたが、Cisco、Juniper共に、QoS設定を行っていない場合でも実はNPU-Fabric内部-NPUを通過する過程でQoS処理が実行されています。これはVoQと呼ばれたりします。
VoQに限らず、様々な加工や優先処理等、実はFabricの中をパケットが単に右から左へ流れているわけではないのです。

このようなメカニズム上、Q3を必ず通ってQoS処理が明確に実行されるFP3ベースの構造は、必ずしも無駄というわけではありません。
また、通信サービスや企業向けVPNサービスを提供するキャリアエッジルータにおいて、QoS制御によるSLA(Service Level Agreement:サービス品質保証)は非常に重要な要素です。
エッジルータとしての位置づけでリリースされているFP3はハードウェアレベルで作りこまれた正統派の設計と言えます。

各社共通の転送性能に関する留意点

Cisco、Juniper、Alcatel-Lucentの3社のエッジルータ製品で共通する注意点が、機能を盛れば盛るほど転送性能が低下するという特性があります。
ここで注意して頂きたいのは、例えばTyphoonで言うとIPv4 4M経路、MACテーブル2Mの「限界値まで収容したとしても、転送性能が劣化するということではない」という点です。
ここで言う”機能”とは、ACLによるパケットフィルタや、QoS、uRPF等、パケット転送時に何らかの付加処理を行うものを指します。
具体的にどの程度の低下があるのか、数値はここではお伝えできませんが、限界性能に対して数パーセント~場合によっては十数パーセントの転送処理能力(PPS値)低下が起こり得ます。
つまり、使い方によっては期待する転送性能が発揮されない可能性があるということを意味します。

これは前回お話しした通り、複雑な機能が実装できる反面、ラインカードのCPUパワーでゴリ押しするNPU設計であるため、単純な右から左への転送以外の機能を有効化すればするほどCPUのパワーをその処理のために割かなければならないためです。

Net One Systemsのラボ

ここで余談ではありますが、弊社のラボについて少しご紹介します。
ネットワンシステムズ テクニカルセンター
筆者はラボと呼んでいますが、正式にはテクニカルセンターでした。

ここには特定の案件やお客様に紐づかない、完全に独立した検証用機材を多数設置されています。その中にはもちろん、Cisco ASR9000、Juniper MX、Alcatel-Lucent SRもそれぞれ複数台あります。
無題26

ラボの機材は基本的に全社員が利用可能ですので、売れ筋機種に関しては壮絶な予約合戦が繰り広げられています。
筆者のような応用技術部所属のバックヤードエンジニアは機能や性能、相互接続性等を細かく調査するための検証を実施しています。
弊社のフロントエンジニアや営業はお客様へご提案する際、前もって実際にその機能が正常に動作するのか、お客様の利用条件下で期待する動作や性能を発揮できるか、といったプリセールス段階での検証も実施しています。

メーカが公表するデータシートを鵜呑みにせず、実際に自分の手で検証したデータを踏まえたご説明をお客様に提供すること、それこそが弊社の価値であると筆者は考えています。
(これは筆者個人の考えであり、ネットワンシステムズの総意を代表するものではありません)

まとめ

本コラムでは、ラインカードに搭載されているNPUの転送性能とスケーラビリティに関する特徴を前・後半でお伝えしました。
もちろん、これだけでルータとしての本質を全て網羅しているわけではないことは、読者の皆様も十分ご承知のことと思います。

実際はパケットがNPUからFabricにInputし、Egress NPUからOutputするまでの過程で、各社様々な工夫を凝らしたメカニズムが実装されています。
Route Processor(RP、RE、CPM等)からラインカードに対してどのように情報が分配されるのか、NeighborやLinkの障害を検知した際にいかに迅速に内部で伝達するのか等等等、知れば知るほど奥が深いのがキャリアエッジルータです。

本コラムでは情報開示の自主規制により、NPUに限定していても、残念ながらほとんどご紹介することはできませんでした。
機会がありましたら別の方法でお伝えできればと思います。

最後に、本コラムは弊社での独自検証の結果のみならず、Cisco社、Juniper社、Alcatel-Lucent社の方々より頂いている情報と合わせて作成しております。
ご協力頂いております皆様には、この場を借りてお礼申し上げます。
今後とも引き続き、何卒よろしくお願い致します。

執筆者プロフィール

渡部 満幸
ネットワンシステムズ株式会社 ビジネス推進本部 第1応用技術部 コアネットワークチーム
所属
入社以来約10年以上、応用技術部でルータ製品の調査及び研究を行い、その結果をもってお客様への提案支援やネットワーク設計、障害解析等の支援を行う
Cisco製品ではローエンドからハイエンド、キャリアグレードルータまで、Juniper/Alcatel製品では主にエッジルータを評価している
Ethernet/IP/MPLS/PPP(oX)等、ルータ製品で動作するプロトコル全般を調査対象としている器用貧乏型

イベント/レポート

pagetop