100기가비트 이더넷의 해방

100GigE 카메라와 100GigE NIC, 서버 및 소프트웨어 출력 간의 연결을 보여주는 다이어그램.

100기가비트 이더넷의 잠재력 발휘: 소니 센서가 실제 고속 시스템 아키텍처와 만납니다

고속 머신 비전은 카메라 중심적 사고방식을 넘어섰습니다. 소니의 최신 Pregius S 센서가 100GigE 성능을 더욱 폭넓은 산업 분야에 제공함에 따라, 진정한 과제는 시스템 아키텍처로 옮겨갔습니다. 바로 대규모 이미지 스트림을 카메라에서 호스트, GPU, 스토리지로 병목 현상 없이 전송하는 것입니다. 이 글에서는 최적화된 제로 카피 GVSP, GigE Vision 3.0/RDMA, 그리고 eSDK Pro 및 eCapture Pro와 같은 소프트웨어 도구를 통해 확장 가능하고 생산 준비가 완료된 파이프라인을 구축하는 방법을 설명합니다.

병목 현상은 더 이상 카메라에 있는 것이 아니라 시스템에 있습니다.

대부분의 머신 비전 엔지니어는 시스템에 오류가 발생하는 시점을 정확히 알고 있습니다. 하지만 카메라 성능 지표는 정상이고, 인터페이스는 최대 대역폭으로 작동하며, 하드웨어 사양도 이론상으로는 충분한 성능을 갖추고 있음에도 불구하고 오류가 발생하는 이유를 설명하지 못하는 경우가 많습니다. 고속 시스템 구축 사례가 증가함에 따라, 문제의 원인은 엔지니어가 찾던 곳에 있지 않은 경우가 많습니다. 최신 산업용 카메라 한 대는 10년 전 머신 비전 시스템 전체가 처리할 수 있었던 양보다 훨씬 많은 데이터를 초당 생성할 수 있습니다. 오늘날 여러 대의 카메라를 사용하는 시스템은 일반적으로 초당 수십 기가바이트의 데이터 전송률을 달성하며, 이러한 성능을 갖춘 센서는 더 이상 희귀하거나 비싼 기술이 아닙니다. 병목 현상이 카메라 내부가 아닌 다른 곳으로 옮겨간 것입니다.

이러한 변화는 단순한 기술적 호기심에 그치지 않습니다. 엔지니어링 노력이 집중되어야 할 방향, 시스템 통합업체가 갖춰야 할 기술, 그리고 실제로 필요한 경험을 보유한 공급업체를 결정짓는 중요한 변화입니다. 이미지 처리는 CPU 기반 아키텍처에서 GPU 가속 파이프라인으로 점차 이동하고 있으며, 센서에 가까운 엣지 컴퓨팅과 결합되는 경우가 많습니다. 이러한 환경에서는 이미지 캡처는 이제 쉬운 부분이 되었고, 데이터 처리가 시스템의 성공과 실패를 가르는 핵심 요소가 되었습니다.

지난 10년간 CMOS 센서 기술은 놀라운 속도로 발전해 왔습니다. 특히 소니는 Pregius 및 Pregius S 플랫폼을 통해 이러한 발전을 주도해 왔으며, 이 플랫폼들은 현대 산업용 이미징의 초석이 되었습니다. 더 높은 해상도, 향상된 감도, 그리고 꾸준히 증가하는 프레임 속도는 불과 몇 년 전만 해도 어렵거나 불가능했던 애플리케이션들을 가능하게 했습니다. 하지만 이러한 발전은 이미징 시스템에서 진정한 엔지니어링 과제가 어디에 있는지를 근본적으로 바꾸어 놓았습니다. 오랫동안 고성능 머신 비전의 주요 병목 현상은 센서 자체이거나 이미지 데이터를 호스트 시스템으로 전송하는 데 사용되는 카메라 인터페이스였습니다. 그러나 오늘날에는 더 이상 그렇지 않습니다. 최신 센서는 엄청난 양의 데이터 스트림을 생성할 수 있으며, 100GigE와 같은 고대역폭 인터페이스는 이를 전송하는 데 충분한 성능을 갖추고 있습니다. 진정한 과제는 이미지 데이터가 카메라를 떠난 후에 시작됩니다.

100GigE 카메라와 100GigE NIC, 서버 및 소프트웨어 출력 간의 연결을 보여주는 다이어그램.

100기가비트 이더넷(GigE) 카메라 시스템 구성도

표준 이더넷 구성 요소를 사용하여 확장 가능한 100GigE 카메라 시스템의 구성입니다.

파워포인트가 현실이 될 때

최근 몇 달 동안 여러 카메라 제조업체들이 마침내 100기가비트 이더넷(100GigE) 카메라를 출시하기 시작했습니다. 이전에는 이러한 플랫폼이 제품 로드맵과 프레젠테이션 슬라이드에만 수년 동안 존재해 왔습니다. 이러한 카메라의 보급 확대는 머신 비전 산업에 중요한 진전입니다. 고속 이더넷 이미징은 기존에는 특수하고 값비싼 하드웨어 인터페이스가 필요했던 애플리케이션들을 가능하게 하며, 머신 비전 시스템이 유연성과 확장성을 제공하는 최신 데이터 센터 아키텍처에 더욱 가까워질 수 있도록 해줍니다.

최근 쏟아지는 발표들 속에서 간과하기 쉬운 점은 고대역폭 이더넷 이미징 기술 자체가 새로운 것이 아니라는 사실입니다. Emergent Vision Technologies는 12년 전에 최초의 10GigE 카메라를 선보였고, 8년 전에는 25GigE 플랫폼, 그리고 6년 전에는 Gpixel 센서 기반의 100GigE 카메라를 출시했습니다. 이러한 플랫폼들은 처음부터 기존 머신 비전 아키텍처가 한계에 도달하는 애플리케이션, 즉 대규모 멀티 카메라 검사 시스템, 볼륨 캡처 스튜디오, 과학 이미징 플랫폼, 그리고 수십 대의 카메라가 필요한 고속 모션 분석 ​​시스템 등을 위해 설계되었습니다. 10년 이상 이러한 환경에서 작업하면서 얻은 명확한 관찰 결과는 카메라 자체가 실제 병목 현상을 일으키는 경우는 드물었다는 것입니다. 결정적인 요소는 거의 항상 카메라를 뒷받침하는 시스템 아키텍처였습니다.

이러한 관찰은 추상적인 것이 아닙니다. 최근 한 고객 구축 사례가 이를 구체적으로 보여줍니다. 식품 가공 업계의 한 제조업체는 최대 21대의 카메라를 동시에 작동시키는 AI 기반 자동 광학 검사 시스템이 필요했습니다. 모든 이미지 데이터는 단일 네트워크 스위치를 통해 3개의 GPU가 장착된 호스트 시스템으로 전송되어야 했습니다. 고객사의 AI 추론 코드는 해당 하드웨어에서 직접 실행되어 전체 카메라 스트림을 실시간으로 처리했으며, 프레임 손실이나 처리 지연을 허용하지 않았습니다. 고객사는 2년 넘게 세계 최대 머신 비전 제조업체 중 하나의 카메라를 사용하여 이러한 아키텍처를 구현하려고 노력해 왔습니다. 하드웨어는 이론상으로는 충분한 성능을 갖추고 있었습니다. 하지만 실제로는 필요한 카메라 수에서 시스템이 안정적으로 작동하지 못했습니다. 표준 GVSP 구현으로 인한 CPU 오버헤드가 GPU 파이프라인이 병목 현상을 일으키기 훨씬 전에 호스트 시스템의 성능을 포화시켰습니다. 프레임 손실이 발생하고, 지연 시간이 일정하지 않았으며, AI 추론 결과도 신뢰할 수 없었습니다. Emergent가 투입되었을 당시, 21대의 카메라로 구성된 전체 시스템은 최적화된 GVSP 드라이버 스택과 Emergent의 실시간 멀티 카메라 데이터 획득 및 처리 소프트웨어인 eCapture Pro 기반의 턴키 솔루션을 사용하여 단일 호스트에서 안정적으로 작동하고 있었습니다. eCapture Pro는 시스템 설정, 모니터링 및 데이터 처리를 위한 그래픽 사용자 인터페이스를 제공합니다. 고객의 AI 추론 코드는 이 프레임워크 내에 맞춤형 플러그인으로 통합되어 추가적인 데이터 처리 오버헤드 없이 들어오는 이미지 스트림을 직접 처리할 수 있었습니다. 덕분에 데이터 획득, 시각화 및 런타임 인프라의 상당 부분을 처음부터 구축할 필요가 없어졌고, 시스템을 안정적으로 운영하는 데 필요한 시간을 크게 단축할 수 있었습니다. 세 개의 GPU는 마침내 본래의 역할인 고객의 AI 코드 실행에 집중할 수 있었고, 더 이상 네트워킹 스택과 CPU 자원을 놓고 경쟁할 필요가 없었습니다. 문제는 카메라가 아니라 데이터 파이프라인이었습니다.

소니 센서가 100GigE 플랫폼을 확장합니다

지금까지 Emergent의 모든 100GigE 영역 스캔 및 라인 스캔 카메라 플랫폼은 고속 이미징에 탁월한 성능을 입증하고 1세대 고대역폭 이더넷 카메라 시스템을 구현한 Gpixel의 센서 제품군을 기반으로 했습니다. 이제 이러한 진화의 다음 단계는 소니의 최신 센서 세대에 의해 주도될 것입니다.

소니의 최신 CMOS 센서는 4세대 Pregius S 기술을 기반으로 고해상도, 고속 프레임 속도 및 향상된 감도를 컴팩트한 픽셀 구조에 결합했습니다. 5.48μm에서 2.74μm에 이르는 픽셀 크기를 통해 산업 검사 시스템에 필요한 이미지 품질과 효율성을 유지하면서 훨씬 더 높은 해상도를 구현합니다. 이 제품군은 고속 중해상도 센서부터 1억 화소 이상의 플랫폼에 이르기까지 폭넓은 성능 범위를 제공하여 다양한 애플리케이션 요구 사항을 충족합니다.

소니의 새로운 센서에는 IMX926, IMX949, IMX925, IMX947, IMX929, IMX928 및 IMX927이 포함됩니다.

HZ-12000-SB(IMX926), HZ-25000-SB(IMX925), HZ-100-SB(IMX927)를 포함한 이 차세대 센서의 첫 번째 모델들은 이미 생산에 들어갔습니다. 소니의 센서 출시 로드맵에 따라 2026년 말과 2027년 초에 걸쳐 추가 카메라들이 출시될 예정입니다. 시스템 관점에서 볼 때, 이 센서들은 단순히 해상도 수치만 높아지는 것이 아닙니다. 최대 성능으로 작동할 경우, 단일 카메라는 초당 수 기가바이트의 이미지 데이터를 생성할 수 있습니다. 여러 대의 카메라를 사용하는 환경에서는 총 데이터 전송량이 초당 수십, 심지어 수백 기가바이트에 달할 수 있으므로, 이러한 데이터를 어떻게 전송하고 처리할 것인지가 그 어느 때보다 중요해집니다.

소니의 로드맵에는 최대 해상도가 필요하지만 센서의 최대 속도는 필요하지 않은 애플리케이션을 겨냥한 IMX937 및 IMX938과 같은 저프레임률 대형 센서 버전도 포함되어 있습니다. 이러한 변형 센서는 애플리케이션 요구 사항에 따라 10GigE 또는 25GigE와 같은 저대역폭 인터페이스와 결합할 수 있으므로 설계 옵션을 다양화하여 고화질을 유지하면서도 비용 효율적인 시스템 아키텍처를 구현할 수 있습니다. 이러한 센서를 기반으로 하는 미래 카메라 플랫폼은 현재의 100GigE 포트폴리오와 기존의 10GigE EROS 및 25GigE BOLT 제품군을 보완하여 시스템 설계자가 다양한 애플리케이션 시나리오에서 해상도, 대역폭 및 전체 시스템 비용 간의 균형을 더욱 유연하게 조정할 수 있도록 지원할 것입니다.

GVSP 과제와 해결 방법

머신 비전 분야에서 GigE Vision은 1, 2.5, 5GigE 설치를 포괄하는 저대역폭 인터페이스 표준으로 오랫동안 자리 잡았습니다. GigE Vision 스트리밍 프로토콜(GVSP)은 이미지 데이터 전송을 담당하는 표준의 핵심 요소이며, 표준 네트워킹 인프라, 폭넓은 소프트웨어 호환성, 그리고 특정 하드웨어에 종속되지 않는다는 장점으로 항상 인기를 누려왔습니다. Emergent는 업계가 앞서 나가기 훨씬 전인 10년 이상 GigE Vision을 고속 영역으로 확장해 왔으며, 이러한 경험을 바탕으로 10, 25, 100GigE로 확장하는 데 따른 구현상의 어려움에도 익숙합니다.

데이터 경로에서 가장 큰 어려움은 이러한 높은 대역폭에서 프로토콜을 어떻게 구현하느냐에 있습니다. 많은 시스템 통합업체들이 처음에는 CPU 사용률 탓으로 돌리지만, 실제로는 메모리 대역폭 문제인 경우가 더 많습니다. 기존 GVSP 구현 방식에서는 수신되는 이미지 데이터가 여러 버퍼 복사본을 거칩니다. 각 복사본은 메모리 대역폭을 소모하며, 여러 대의 카메라 스트림이 동시에 처리되는 높은 데이터 전송률에서는 이러한 누적 부하가 CPU 자체의 성능 제한 요소가 되기 훨씬 전에 시스템을 빠르게 포화시킵니다. 그 결과는 흔히 볼 수 있는 프레임 드롭, 불안정한 동작, 그리고 CPU 사용률이 수치상으로는 관리 가능한 것처럼 보이더라도 호스트 시스템이 제대로 작동하지 못하는 현상입니다.

Emergent는 처음부터 제로 카피 GVSP 아키텍처를 통해 이 문제를 해결했습니다. 데이터를 연속적인 메모리 버퍼를 거쳐 전송하는 대신, 이 구현 방식은 이미지 데이터를 단일 전송으로 최종 목적지에 직접 배치합니다. 이를 통해 기존 방식보다 최대 3배 높은 메모리 대역폭 오버헤드를 제거하고 CPU 상호 작용을 표준에서 요구하는 최소한의 수준으로 줄입니다. 그림 2에서 볼 수 있듯이, 기존 GVSP 구현 방식과 제로 카피 아키텍처 간의 차이는 상당하며, 시스템에 카메라 스트림이 추가될수록 그 차이는 더욱 두드러집니다.

GVSP를 사용하여 시스템 메모리와 CPU를 거치는 카메라 데이터의 기존 경로를 보여주는 다이어그램.

100GigE 카메라용 기존 GVSP 데이터 경로

그림 2: 기존 GVSP 데이터 흐름은 여러 메모리 복사와 CPU 기반 프레임 재구성을 보여주는데, 이는 고속 100GigE 이미징에서 시스템 오버헤드를 증가시킵니다.

100GigE 카메라 데이터에 최적화된 GVSP 프로세스

100GigE 카메라에 최적화된 GVSP 프로세스

그림 3: 최적화된 제로 카피 GVSP 데이터 흐름은 네트워크 인터페이스 카드에서 프레임을 전송하기 위해 직접 DMA를 사용하므로 메모리 복사를 최소화하고 CPU 개입을 제어 작업에만 국한합니다.

RDMA 및 GigE Vision 3.0

이 분야의 다음 단계는 곧 출시될 GigE Vision 3.0 표준입니다. 이 표준은 RDMA(원격 직접 메모리 접근)를 기본적으로 지원합니다. RDMA는 표준 수준에서 제로 카피 데이터 전송을 구현하여 네트워크 인터페이스가 중간 복사본 없이, 그리고 각 패킷에 대한 CPU 개입 없이 이미지 데이터를 애플리케이션 메모리 버퍼로 직접 전송할 수 있도록 합니다. 이러한 점에서 RDMA는 Emergent의 최적화된 GVSP 아키텍처가 수년간 해결해 온 메모리 대역폭 문제를 해결하면서도 업계 전반에 걸쳐 더욱 폭넓게 활용할 수 있도록 합니다. 이 표준은 현재 공식적으로 승인되었거나 승인 최종 단계에 있을 것으로 예상됩니다.

Emergent에게 있어 이는 익숙한 영역입니다. 제로 카피 원칙은 Emergent의 GVSP 구현의 핵심이었으며, 고대역폭 멀티 카메라 구축 환경에서 아키텍처 비효율성을 용납할 수 없는 운영상의 필요성에서 개발되었습니다. GigE Vision 3.0은 이제 이러한 기능을 더 넓은 범위의 구현에 제공하며, Emergent는 두 가지 접근 방식을 모두 완벽하게 지원합니다. 하지만 RDMA에는 나름의 장단점이 있습니다. 특정 구현에서는 멀티캐스트 스트리밍에 제약이 발생하는데, 이는 확장 가능한 멀티 카메라 시스템에서 여전히 중요한 역할을 합니다. 그림 3에서 볼 수 있듯이 각 전송 방식은 고유한 특성을 가지고 있으며, 최적의 선택은 대역폭 수치뿐만 아니라 전체 시스템 컨텍스트에 따라 달라집니다.

제품 특장점

전통적인 GVSP

최적화된 GVSP(신흥)

RDMA(기가비트 이펙트 비전 3.0)

CPU로드 높음 매우 낮은 매우 낮은
데이터 사본 1 0 0
기성품 NIC 가능 가능 예 (최적화된 GVSP와 유사합니다)
GPUDirect(리눅스) 아니 가능 가능
GPUDirect(Windows) 아니 가능 아니
멀티캐스트 완전한 지원 완전한 지원 지원되지 않음
통합 용이성 표준 준수 표준 준수 표준 준수(GigE Vision 3.0)
확장성(다중 카메라) 제한된 증명 된 용도에 따라 다릅니다

카메라 스트림에서 데이터 파이프라인까지

이미지 데이터가 호스트 시스템에 도달하면 본격적인 작업이 시작됩니다. 최신 고성능 이미징 시스템은 검사, 재구성 또는 AI 추론을 위해 GPU 기반 처리 파이프라인에 점점 더 의존하고 있으며, 네트워크 인터페이스에서 GPU 메모리로 데이터를 효율적으로 전송하는 것 자체가 중요한 엔지니어링 과제입니다. Windows의 GPU Direct와 같은 기술은 최소한의 오버헤드로 네트워크 인터페이스에서 GPU 메모리로 이미지 데이터를 전송할 수 있도록 하여, 처리량을 제한하는 CPU 병목 현상을 방지합니다.

실제로 이러한 메커니즘을 애플리케이션 파이프라인에 효율적으로 통합하는 것은 특히 여러 개의 고대역폭 스트림을 처리할 때 결코 간단하지 않습니다. 총 데이터 전송량이 초당 수십 또는 수백 기가바이트에 달하는 멀티 카메라 환경에서는 카메라 인터페이스, 시스템 메모리, GPU 처리 파이프라인 및 스토리지 인프라 간의 통합을 처음부터 끝까지 신중하게 설계해야 합니다. 그림 4에서 볼 수 있듯이 이러한 아키텍처는 소형 단일 카메라 엣지 시스템부터 네트워크 스위치와 여러 GPU 워크스테이션을 중심으로 구축된 대규모 멀티 카메라 시스템에 이르기까지 다양합니다. 기존의 프레임 그래버 기반 접근 방식과의 차이점은 분명합니다. 이더넷 기반 시스템은 표준 네트워크 인프라를 사용하여 유연한 확장이 가능한 반면, 프레임 그래버 아키텍처는 카메라 그룹별로 전용 하드웨어가 필요하며 그에 따라 복잡성과 비용이 증가합니다.

GigE 카메라와 CoaXpress 카메라의 확장성 차이를 보여주는 다이어그램

GigE 카메라와 CoaXpress 시스템의 확장성 비교

그림 4: 확장 가능한 이더넷 기반 멀티 카메라 아키텍처와 기존 프레임 그래버 기반 시스템의 비교.

경제적인 측면 또한 중요합니다. 일부 고속 이미징 시스템에서는 단순히 하드웨어를 추가하는 것만으로 안정성을 확보합니다. 즉, 추가 서버, 전용 네트워크 인터페이스, 부하 분산을 위한 별도의 처리 노드 등을 구축하는 것입니다. 이러한 방식이 효과적일 수는 있지만, 불필요하게 복잡하고 비용이 많이 드는 아키텍처를 초래하는 경우가 많습니다. 데이터 전송을 최적화하고, CPU 오버헤드를 줄이며, 처음부터 효율적인 처리 파이프라인을 설계하면 더 적은 수의 호스트 시스템에서 훨씬 더 많은 카메라를 지원할 수 있습니다. 안정적인 다중 카메라 설치는 컴퓨터 한 대당 카메라 한 대를 연결하는 방식을 요구하지 않습니다. 신중하게 설계된 시스템은 하드웨어 요구 사항과 운영 복잡성을 관리하면서 수십 대의 카메라까지 확장할 수 있으며, 성능, 안정성 및 비용 간의 균형이 고속 이미징 프로젝트가 상용화 단계로 이어질지 아니면 개념 증명 단계에 머물지를 결정하는 중요한 요소입니다.

이러한 통합을 간소화하기 위해, 올해 초 인비전이 선정한 '2026년 최고의 혁신 기술' 중 하나인 eSDK Pro와 같은 소프트웨어 프레임워크는 GPU Direct를 포함한 최적화된 데이터 경로에 대한 접근을 제공합니다. 이러한 접근 방식을 통해 시스템 설계자는 광범위한 저수준 개발이 필요한 대신, 애플리케이션 로직에 집중하고 고성능 이미징 파이프라인 구축 시 전송, 메모리 처리 및 인터페이스 수준 최적화에 수백 시간의 엔지니어링 시간을 낭비하지 않을 수 있습니다.

고속 비전의 다음 단계

소니의 최신 센서 세대가 생산에 들어가고 GigE Vision 3.0이 업계 전반에 RDMA 지원을 제공함에 따라 고속 이더넷 이미징이 새로운 국면에 접어들고 있습니다. 고성능 센서, 고대역폭 이더넷 인프라, 그리고 최신 GPU 컴퓨팅 아키텍처가 융합되면서 기존에는 대부분의 시스템 통합업체가 구현할 수 없었던 애플리케이션들이 가능해지고 있습니다. 더 많은 기업들이 이 분야를 탐색하기 시작할 것이며, 기술 자체도 빠르게 발전할 것입니다.

하지만 지난 10년간 실제 구축 사례를 통해 일관되게 드러난 것은 카메라 사양이 성공을 결정짓는 요인이 아닌 경우가 많다는 점입니다. 생산 현장에서 안정적으로 작동하는 시스템은 센서에서 인터페이스, 인터페이스에서 호스트, 호스트 메모리에서 GPU, 그리고 최종적으로 저장 장치나 출력 장치에 이르기까지 이미징 파이프라인의 모든 단계에서 전체 데이터 흐름을 고려하여 설계된 시스템입니다. 21대의 카메라가 설치된 식품 가공 라인이 제대로 작동하는 솔루션 없이 2년간 가동된 사례는 예외가 아닙니다. 오히려 일반적인 현상입니다. 고속 영상 기술에서 진정한 병목 현상은 카메라가 아니라 시스템 아키텍처에 있습니다. 그리고 이러한 아키텍처를 제대로 구축하려면 어떤 데이터시트에서도 얻을 수 없는 경험, 즉 실제 운영 환경에서 대규모로 구축한 실제 경험을 활용해야 합니다.

Emergent Vision Technologies의 100GigE 영역 스캔 및 라인 스캔 카메라

ZENITH 100GigE는 속도와 해상도 면에서 최고입니다.

제니스 100GigE 카메라

프레임 속도: 16-3462 FPS
해상도: 2.5MP-152MP
크로마: 컬러, 모노

PINNACLE은 검사 및 분류를 위한 최고 속도입니다.

PINNACLE 100GigE 카메라

라인 속도: 400-1000kHz
해상도: 8K-16K TDI, 16Kx16
크로마: 컬러, 모노