BEネットワークス ブログ

SONiC ネットワークをサポートする遠隔測定および観測可能性ツール トップ 5

TL;DR - Verity は、SONiC ネットワークを完全に可視化するために必要なすべてのツールを自動的にインストールし、操作します。

ネットワークが複雑化し、ディスアグリゲーションがデータセンター環境を再構築し続ける中、観測可能性がかつてないほど重要になっている。SONiC (Software for Open Networking in the Cloud) は、ハイパースケールやエンタープライズ・ネットワーク向けの強力なオープンソース NOS として登場しました。しかし、SONiC の柔軟性には、堅牢な遠隔測定と観測可能性ツールの必要性が伴います。ディープパケットインスペクションからリアルタイムストリーミングまで、SONiC ベースのインフラストラクチャを展開および管理する際に私が推奨する(そして頼りにしている)ツールのトップ 5 をご紹介します。

1. OpenConfigによるgNMI/gNOI

SONiCのサポート gNMI(gRPCネットワーク管理インターフェイス)gNMI は、OpenConfig モデルを使用して、構造化された遠隔測定ストリーミングを可能にします。gNMIは、インターフェイスカウンター、BGPセッション、キューメトリクスをリアルタイムでサブスクライブすることができます。証明書のローテーションやソフトウェアのアップグレードなどの操作のために gNOI とペアリングされたこのツールセットは、SONiC デバイスを宣言的に管理するために不可欠です。

🔧 なぜそれが重要なのか: ポーリングなしの高性能遠隔測定。gNMIプラグインによるSONiCのネイティブサポートにより、データレイクやInfluxDB、Prometheusなどのプラットフォームとシームレスに統合できます。

2.プロメテウス+Grafana

SONiC は、gNMI による Prometheus へのテレメトリのエクスポートや、特定のメトリクス用のネイティブ Prometheus エクスポーターをサポートしています。Prometheus は時系列データをスクレイピングして保存し、Grafana がその上に載ってリアルタイムのダッシュボードを提供する。

🎯 ユースケース バッファ占有率、CPU 使用率、ACL ヒット率をスイッチ単位で可視化できます。Grafana は、輻輳やマイクロバーストをトラブルシューティングする際に理想的な、異常の発見を容易にします。

🛠 プロのアドバイス Grafana のテンプレート機能を使用して、SONiC スイッチのフリート全体で拡張可能な動的ダッシュボードを作成します。

3.ThanosまたはVictoriaMetrics(長期メトリクスストレージ)

Prometheusは短期的なデータには素晴らしいが、分散環境における遠隔計測のスケーリングは、長期的なストレージとマルチインスタンスのクエリーフェデレーションを扱うことを意味する。ThanosやVictoriaMetricsの出番だ。

📦 SONiCチームが気になる理由 BGPフラップと90日間にわたるトラフィックの急増を相関させる必要がある場合、Thanosは事実上無制限のスケーラビリティを持つ永続的なバックエンドを提供します。

4. sFlowとpmacct

SONiCはsFlowをネイティブにサポートしており、パフォーマンスへの影響を最小限に抑えながら、ASICレベルでパケットをサンプリングすることができます。次のようなツールがあります。 pmacct はこれらのフローを取り込み、L2-L7トラフィック分析を提供することができる。

📡 実際に トラフィックエンジニアリング、キャパシティプランニング、セキュリティモニタリングに便利です。ELKスタックやKafkaと組み合わせることで、より深い洞察が得られます。

🚀 ボーナスだ: sFlowとSONiCのインバンド・テレメトリー(INT)は、可視性を提供する。 内部 生地の端だけでなく

5.FRRログ解析とSyslogアグリゲータ

SONiCは、ルーティングスタックとしてFRRouting(FRR)を使用している。構造化された遠隔測定は理想的だが、時にはログに頼る必要がある。次のようなツールがあります。 rsyslog, グレイログあるいは エラスティック・スタック SONiCデバイスからのログを集約し、コントロールプレーンの動作に関する詳細な情報を提供します。

🧠 なぜ、まだ関連性があるのか: BGPが横道にそれたり、LACPが誤動作したりすると、ログが最初に物語を語ることが多い。

SONiCユーザーへの最終的なメッセージ

SONiC におけるテレメトリーは、単なるチェックボックスではありません。分離されたクラウド ネイティブ ネットワークでサービスの信頼性を維持するための基礎となる部分です。上記のツールは、本格的な SONiC 展開のテレメトリーのバックボーンを形成します。最大限の可視性と最小限のダウンタイムのために、これらを組み合わせて使用してください。

Josh Saulの写真

ジョシュ・ソール

プロダクト・マーケティング担当副社長

Josh Saul has pioneered open source network solutions for more than 25 years. As an architect, he built core networks for GE, Pfizer and NBC Universal. As an engineer at Cisco, Josh advised customers in the Fortune 100 financial sector and evangelized new technologies to customers. More recently, Josh led marketing and product teams at VMware (acquired by Broadcom), Cumulus Networks (acquired by NVIDIA), and Apstra (acquired by Juniper).

ja
お問い合わせ
私たちはネットワークについて話すのがとても好きなんだ!