100ギガビットイーサネットの真価

100ギガビットイーサネットカメラから100ギガビットイーサネットNIC、サーバー、ソフトウェア出力までの接続を示す図。

100ギガビットイーサネットの真価が解き放たれる: ソニーのセンサーが実世界の高速システムアーキテクチャと出会う

高速マシンビジョンは、もはやカメラ中心の考え方では対応しきれません。ソニーの最新Pregius Sセンサーが100GigEの性能をより幅広い産業用途にもたらすにつれ、真の課題はシステムアーキテクチャへと移行しています。つまり、膨大な画像ストリームをカメラからホスト、GPU、ストレージへとボトルネックなく転送することです。この記事では、最適化されたゼロコピーGVSP、GigE Vision 3.0/RDMA、そしてeSDK ProやeCapture Proといったソフトウェアツールが、拡張性と実用性を備えたパイプラインをどのように実現するのかを解説します。

ボトルネックはもはやカメラではなく、システムにある。

ほとんどのマシンビジョンエンジニアは、システムが故障しているタイミングを正確に把握しています。しかし、カメラの計測値は問題なく、インターフェースはフル帯域幅で動作し、ハードウェアの仕様上は十分な性能を備えているはずなのに、なぜ故障するのかを説明できないことがよくあります。高速化が進むにつれて、その答えは、問題が彼らが探していた場所にはなかったということです。現代の産業用カメラ1台で、10年前のマシンビジョンシステム全体で処理できたデータ量よりも多くのデータを毎秒生成できます。現在では、マルチカメラシステムでは、データレートが毎秒数十ギガバイトに達することが日常的にあり、このような処理が可能なセンサーはもはや特殊でも高価でもありません。ボトルネックは移動しました。もはやカメラ内部にはないのです。

この変化は単なる技術的な興味の対象にとどまりません。エンジニアリングの取り組みの方向性、システムインテグレーターに必要なスキル、そして実際にその経験を持つサプライヤーがどこになるのか、といった点に変化をもたらします。画像処理は、CPUベースのアーキテクチャからGPUアクセラレーションパイプラインへと移行しつつあり、多くの場合、センサーに近いエッジコンピューティングと組み合わされています。こうした環境では、画像の取得は容易な部分となっています。システムの成否は、データの処理にかかっています。

過去10年間、CMOSセンサー技術は驚異的なスピードで進歩してきました。特にソニーは、PregiusおよびPregius Sプラットフォームでこれらの開発を牽引し、現代の産業用イメージングの基盤となっています。高解像度、感度の向上、そして着実に向上するフレームレートにより、ほんの数年前には困難、あるいは不可能だったアプリケーションが実現可能になりました。しかし、この進歩は、イメージングシステムにおける真のエンジニアリング上の課題がどこにあるかを根本的に変えました。長い間、高性能マシンビジョンの主なボトルネックは、センサー自体か、画像データをホストシステムに転送するために使用されるカメラインターフェースのいずれかでした。今日では、もはやそうではありません。最新のセンサーは膨大なデータストリームを生成でき、100GigEなどの高帯域幅インターフェースはそれらを十分に転送できます。真の課題は、画像データがカメラから出力された後に始まります。

100ギガビットイーサネットカメラから100ギガビットイーサネットNIC、サーバー、ソフトウェア出力までの接続を示す図。

100ギガビットイーサネットカメラシステム構成図

標準的なイーサネットコンポーネントを使用して拡張可能な、100ギガビットイーサネットカメラシステムの構成。

PowerPointが現実になるとき

ここ数ヶ月、複数のカメラメーカーがついに初の100ギガビットイーサネット(100GigE)カメラの発売を開始しました。これらのカメラは、これまで長年にわたり製品ロードマップやプレゼンテーション資料の中にしか存在していませんでした。こうしたカメラの普及は、マシンビジョン業界にとって重要な一歩です。高速イーサネットイメージングは​​、これまで特殊で高価なハードウェアインターフェースを必要としていたアプリケーションへの道を開き、マシンビジョンシステムを、柔軟性と拡張性を備えた最新のデータセンターアーキテクチャに近づけることを可能にします。

最近の発表ラッシュで見落とされがちなのは、高帯域幅イーサネットイメージング自体は新しい技術ではないという点だ。Emergent Vision Technologiesは12年以上前に最初の10GigEカメラを発表し、8年以上前に25GigEプラットフォーム、6年以上前にGpixelセンサーをベースとした100GigEカメラを発表した。これらのプラットフォームは当初から、従来のマシンビジョンアーキテクチャではすぐに限界に達するようなアプリケーション向けに設計されていた。大規模なマルチカメラ検査システム、ボリュームキャプチャスタジオ、科学イメージングプラットフォーム、そしてカメラの数が1桁ではなく数十台にも及ぶ高速モーション解析システムなどだ。こうした環境で10年以上作業してきた結果、ある単純な事実が明らかになった。カメラ自体が真のボトルネックになることはほとんどなく、決定的な要因はほぼ常にその背後にあるシステムアーキテクチャだったのだ。

その観察は抽象的なものではありません。最近の顧客導入事例がそれを具体的に示しています。食品加工業界のあるメーカーは、最大21台のカメラを同時に実行し、すべての画像データが単一のネットワークスイッチを経由して3つのGPUを搭載した1つのホストシステムにルーティングされるAIベースの自動光学検査システムを必要としていました。顧客独自のAI推論コードは、そのハードウェア上で直接実行され、フレームのドロップや処理の遅延を許容することなく、カメラストリーム全体をリアルタイムで処理しました。顧客は2年以上にわたり、世界最大のマシンビジョンメーカーの1つから提供されたカメラでこのアーキテクチャを動作させようと試みてきました。ハードウェアは理論上は十分な性能を備えていました。しかし実際には、システムは必要なカメラ数で安定した動作を維持できませんでした。標準的なGVSP実装によるCPUオーバーヘッドが、GPUパイプラインが制限要因になるずっと前にホストを飽和させていました。フレームがドロップされ、レイテンシが不安定で、AI推論の結果が信頼できませんでした。 Emergent社が導入した時点では、21台のカメラからなるシステム全体が、10GigEカメラと最適化されたGVSPドライバスタック、そしてEmergent社のリアルタイムマルチカメラ取得・処理ソフトウェアであるeCapture Pro(システム設定、監視、データ処理用のグラフィカルユーザーインターフェースを備えたターンキーシステム)を組み合わせた構成で、同一ホスト上で安定して稼働していました。顧客のAI推論コードは、このフレームワーク内にカスタムプラグインとして統合され、追加のデータ処理オーバーヘッドなしに、入力画像ストリームを直接処理できるようになりました。これにより、取得、可視化、ランタイムインフラストラクチャの大部分をゼロから構築する必要がなくなり、システムを安定稼働させるのに必要な時間を大幅に短縮できました。3つのGPUは、ネットワークスタックとCPUサイクルを奪い合うのではなく、顧客のAIコードを実行するという本来の役割をようやく果たすようになりました。問題はカメラではなく、データパイプラインだったのです。

ソニーのセンサーが100GigEプラットフォームを拡張

これまで、Emergent社の100ギガビットイーサネット対応エリアスキャンおよびラインスキャンカメラプラットフォームはすべて、Gpixel社のセンサーファミリーをベースとしており、高速イメージングにおいて高い性能を発揮し、高帯域幅イーサネットカメラシステムの第一世代を実現してきました。この進化の次のステップは、ソニーの最新世代センサーによって推進されます。

ソニーの最新CMOSセンサーは、Pregius S第4世代技術をベースとし、高解像度、高フレームレート、そして感度向上をコンパクトな画素構造に融合させています。画素サイズは5.48μmから2.74μmまで幅広く対応し、産業検査システムが求める画質と効率性を維持しながら、大幅に高解像度化を実現します。高速中解像度センサーから1億画素を超えるプラットフォームまで、幅広い性能範囲を網羅し、多様なアプリケーションニーズに対応します。

ソニーの新しいセンサーには、IMX926、IMX949、IMX925、IMX947、IMX929、IMX928、IMX927が含まれます。

この新世代の最初のモデルであるHZ-12000-SB(IMX926)、HZ-25000-SB(IMX925)、HZ-100-SB(IMX927)は既に生産開始されています。ソニーのセンサーリリースロードマップに沿って、2026年後半から2027年初頭にかけて、さらに多くのカメラが順次登場する予定です。システムの観点から見ると、これらのセンサーは単に高解像度という数値以上の意味を持ちます。フルパフォーマンスでは、1台のカメラで毎秒数ギガバイトの画像データを生成できます。マルチカメラ環境では、データレートはすぐに毎秒数十ギガバイト、あるいは数百ギガバイトにまで拡大するため、データの転送と処理方法がこれまで以上に重要になります。

ソニーのロードマップには、IMX937やIMX938クラスなど、これらの大型センサーの低フレームレートバージョンも含まれており、最大解像度は必要だがセンサーのフルスピードは必要ないアプリケーションを対象としています。これらのバリアントは、アプリケーションの要件に応じて10GigEや25GigEなどの低帯域幅インターフェースと組み合わせることができるため、設計の選択肢が広がり、高画質を維持しながらコスト効率の高いシステムアーキテクチャを実現できます。これらのセンサーをベースとした将来のカメラプラットフォームは、既存の100GigEポートフォリオに加え、定評のある10GigE EROSおよび25GigE BOLTファミリーを補完し、システム設計者がさまざまなアプリケーションシナリオにおいて、解像度、帯域幅、およびシステム全体のコストのバランスをより柔軟に取れるようにします。

GVSPの課題とその解決方法

マシンビジョンにおいて、GigE Visionは1、2.5、5GigEの低帯域幅環境における確立されたインターフェース標準として長年君臨してきました。GigE Vision Streaming Protocol(GVSP)は、この標準規格の中で実際の画像データ転送を担う部分であり、その魅力は常に同じです。標準的なネットワークインフラストラクチャ、幅広いソフトウェア互換性、そして独自のハードウェアに縛られないことです。Emergentは、業界他社が追随するずっと前から10年以上にわたりGigE Visionを高速領域へと押し上げてきました。だからこそ、10、25、100GigEへの拡張に伴う実装上の課題は、同社にとって目新しいものではないのです。

データパス課題は、これらの高帯域幅でそのプロトコルをどのように実装するかという点にあります。多くのインテグレーターが当初CPU使用率のせいにする原因は、より正確にはメモリ帯域幅の問題です。従来のGVSP実装では、入力画像データは複数のバッファコピーを経由します。各コピーはメモリ帯域幅を消費し、複数のカメラストリームが同時に高データレートで動作する場合、CPU自体が制限要因になるずっと前に、累積負荷がシステムを急速に飽和させてしまいます。その結果はよく知られています。フレーム落ち、不安定な動作、そしてCPU使用率が紙面上では管理可能に見える場合でもホストシステムが苦戦する、といった事態です。

Emergent社は、ゼロコピーGVSPアーキテクチャを採用することで、この問題に最初から対処しました。この実装では、データを連続するメモリバッファにルーティングするのではなく、画像データを単一の転送で最終宛先に直接配置します。これにより、従来の方式に比べて最大3倍のメモリ帯域幅オーバーヘッドが削減され、CPUとのやり取りも標準で求められる最小限に抑えられます。図2に示すように、従来のGVSP実装とゼロコピーアーキテクチャの違いは大きく、システムにカメラストリームが追加されるたびにその差は顕著になります。

GVSPを使用したカメラデータの従来経路(システムメモリとCPUを経由する経路)を示す図。

100ギガビットイーサネットカメラ用の従来型GVSPデータパス

図2:従来のGVSPデータフロー。複数のメモリコピーとCPUベースのフレーム再構成を示しており、高速100GigEイメージングにおけるシステムオーバーヘッドを増加させる。

100GigEカメラデータ向けに最適化されたGVSPプロセス

100ギガビットイーサネットカメラ向けに最適化されたGVSPプロセス

図3:最適化されたゼロコピーGVSPデータフローは、ダイレクトDMAを使用してネットワークインターフェイスカードからフレームを転送し、メモリコピーを最小限に抑え、CPUの関与を制御タスクのみに減らします。

RDMAとGigE Vision 3.0

この分野における次の進化は、RDMA(リモートダイレクトメモリアクセス)のネイティブサポートを導入する、間もなく登場するGigE Vision 3.0規格です。RDMAは、標準レベルでゼロコピーデータ転送を実現し、ネットワークインターフェースが中間コピーを必要とせず、パケットごとにCPUの介入も必要とせずに、画像データをアプリケーションのメモリバッファに直接転送できるようにします。この点において、RDMAはEmergent社の最適化されたGVSPアーキテクチャが長年解決してきたメモリ帯域幅の問題に対処しつつ、業界全体でより広く利用できるようにするものです。本稿執筆時点では、この規格は正式に承認されているか、承認の最終段階にあると予想されています。

Emergentにとって、これは馴染みのある領域です。ゼロコピーの原則は、当初から同社のGVSP実装の中核を成しており、アーキテクチャの非効率性を許容できない高帯域幅のマルチカメラ展開における運用上の必要性から開発されました。GigE Vision 3.0は、この機能をより幅広い実装にもたらすようになり、Emergentは両方のアプローチを完全にサポートしています。とはいえ、RDMAには独自のトレードオフがあります。一部の実装では、スケーラブルなマルチカメラシステムで重要な役割を果たし続けるマルチキャストストリーミングに制約が生じます。図3に示すように、各伝送方式にはそれぞれ異なる特性があり、適切な選択は帯域幅の数値だけでなく、システム全体の状況によって決まります。

機能

従来のGVSP

最適化されたGVSP(Emergent)

RDMA(GigE Vision 3.0)

CPU負荷 ハイ とても低い とても低い
データコピー 1 0 0
市販のNIC あり あり はい(最適化されたGVSPと同様)
GPUDirect (Linux) いいえ あり あり
GPUDirect(Windows版) いいえ あり いいえ
マルチキャスト 完全にサポート 完全にサポート 「鑑定対象外」
統合の容易さ 規格に準拠 規格に準拠 規格準拠(GigE Vision 3.0)
拡張性(マルチカメラ対応) 限定的 実証済み アプリケーションによって異なります

カメラ映像からデータパイプラインまで

画像データがホストシステムに到達すると、いよいよ本格的な処理が始まります。最新の高性能画像処理システムは、検査、再構成、AI推論などにGPUベースの処理パイプラインをますます活用するようになり、ネットワークインターフェースからGPUメモリへデータを効率的に転送すること自体が、大きな技術的課題となっています。WindowsのGPU Directなどの技術を用いることで、画像データをネットワークインターフェースからGPUメモリへ最小限のオーバーヘッドで転送することが可能になり、スループットを制限するCPUボトルネックを回避できます。

実際には、これらのメカニズムをアプリケーション パイプラインに効率的に統合することは、特に複数の高帯域幅ストリームを扱う場合、容易ではありません。総データ レートが毎秒数十ギガバイト、あるいは数百ギガバイトに達するマルチ カメラ環境では、カメラ インターフェイス、システム メモリ、GPU 処理パイプライン、ストレージ インフラストラクチャ間の統合をエンドツーエンドで慎重に設計する必要があります。図 4 に示すように、これらのアーキテクチャは、コンパクトなシングル カメラ エッジ システムから、ネットワーク スイッチと複数の GPU ワークステーションを中心に構築された大規模なマルチ カメラ インスタレーションまで多岐にわたります。従来のフレーム グラバー ベースのアプローチとの対比は顕著です。イーサネット ベースのシステムでは、標準的なネットワーク インフラストラクチャを使用して柔軟にスケーリングできますが、フレーム グラバー アーキテクチャではカメラ グループごとに専用のハードウェアが必要となり、複雑さとコストが増大します。

GigEカメラとCoaXpressカメラの拡張性の違いを示す図

GigEカメラとCoaXpressシステムの拡張性の比較

図4:拡張可能なイーサネットベースのマルチカメラアーキテクチャと従来のフレームグラバーベースのシステムとの比較。

経済的な側面も重要です。高速なシステム展開の中には、単にハードウェアを追加することで安定性を確保できるものもあります。具体的には、サーバーの追加、専用ネットワークインターフェース、負荷分散のための独立した処理ノードなどです。この方法は有効な場合もありますが、多くの場合、不必要に複雑で高価なアーキテクチャを生み出してしまいます。データ転送を最適化し、CPUオーバーヘッドを削減し、最初から効率的な処理パイプラインを設計することで、より少ないホストシステムで、はるかに多くのカメラをサポートすることが可能になります。安定したマルチカメラシステムには、コンピュータ1台につきカメラ1台というアプローチは必要ありません。慎重に設計されたシステムは、ハードウェア要件と運用上の複雑さを抑えながら、数十台のカメラまで拡張できます。そして、パフォーマンス、安定性、コストのバランスこそが、高速イメージングプロジェクトが実用化に成功するか、概念実証に留まるかを決定づける重要な要素となるのです。

この統合を簡素化するために、eSDK Pro(今年初めにInVision社から「2026年のトップイノベーション」に選出された)などのソフトウェアフレームワークは、GPU Directを含む最適化されたデータパスへのアクセスを提供します。これらのアプローチにより、システム設計者は広範な低レベル開発を必要とせず、アプリケーションロジックに集中でき、高性能イメージングパイプラインを構築する際に、トランスポート、メモリ処理、インターフェースレベルの最適化に何百時間ものエンジニアリング時間を費やす必要がなくなります。

高速ビジョンの次の段階

ソニーの最新世代センサーが量産体制に入り、GigE Vision 3.0がRDMAサポートを業界全体にもたらすことで、高速イーサネットイメージングは​​新たな局面を迎えています。高性能センサー、高帯域幅イーサネットインフラ、そして最新のGPUコンピューティングアーキテクチャが融合することで、これまでほとんどのシステムインテグレーターにとって手の届かなかったアプリケーションが実現可能になります。今後、より多くの企業がこの分野への参入を始め、技術自体も急速に成熟していくでしょう。

しかし、過去10年間の実際の導入事例が一貫して示しているのは、カメラの仕様が成功を左右することはほとんどないということです。本番環境で確実に動作するシステムは、イメージングパイプラインのあらゆる段階において、センサーからインターフェース、インターフェースからホスト、ホストメモリからGPU、そしてストレージや出力に至るまで、データフロー全体を念頭に置いて設計されています。21台のカメラを搭載した食品加工ラインが、有効なソリューションがないまま2年間稼働していたのは例外ではなく、むしろ一般的なケースです。高速ビジョンにおいて、真のボトルネックはカメラではなく、システムアーキテクチャなのです。そして、そのアーキテクチャを正しく構築するには、データシートでは決して得られないもの、つまり、実際の運用条件下で、大規模な実環境での導入から得られる経験が必要です。

Emergent Vision Technologies社の100ギガビットイーサネット対応エリアスキャンカメラおよびラインスキャンカメラ

ZENITH 100GigE は究極の速度と解像度を実現します。

ZENITH 100GigE カメラ

フレームレート: 16~3462 FPS
解像度: 2.5MP-152MP
彩度: カラー、モノクロ

PINNACLE は検査と選別の最高速度です。

PINNACLE 100GigE カメラ

ラインレート: 400~1000kHz
解像度: 8K-16K TDI、16Kx16
彩度: カラー、モノクロ