기술 포털
기술 포털
성능 기술: Zero Copy UDP 대 RDMA/RoCEv2
성능 시스템은 여러 가지로 구성될 수 있습니다. 25GigE 카메라 저렴한 비용으로 활용되는 멀티플렉싱 및 PTP 기능으로 몇 대의 서버와 통신 스위치.
성능 시스템은 저비용 스위치에서 사용하는 것과 동일한 멀티플렉싱 및 PTP 기능을 갖춘 몇 대의 서버와 통신하는 더 적은 수의 100GigE 카메라로 구성될 수도 있습니다.
지원되는 NIC
GigE 비전 구현
이제 우리는 공연에서 무엇을 찾아야 하는지를 이해하기 위해 더 깊이 들어가겠습니다. GigE 비전 구현. 이 짧은 애니메이션은 GigE Vision 네트워크 패킷을 이미지로 분할하는 과정을 보여줍니다. 헤더, 리더 및 예고편은 제어 프로세스에 의해 소비되는 반면 이미지 부분은 연속 메모리 버퍼에 저장됩니다. 이 프로세스에 소프트웨어를 사용하면 전체 패킷이 메모리에 기록된 다음 이미지 부분을 메모리에서 읽어 조각화되지 않은(또는 연속적인) 방식으로 다른 메모리 위치에 다시 써야 합니다. 이 프로세스는 메모리 대역폭의 3배에 해당하는 소프트웨어에서 수행할 수 있으며, 최적의 성능을 위해 카드 헤더 분할 기능을 통해 수행할 수도 있습니다. 기존 GigE Vision과 TCP는 모두 저성능 프로세스의 예입니다. 그리고 일부 TCP 구현자의 보장된 전송 메커니즘 주장에 속지 마십시오. 이는 단순히 프레임을 수신하면 이 프레임이 손상 없이 완료될 것이라고 말하는 것입니다. 이는 프레임이 삭제되지 않는다는 보장이 아닙니다. 어떤 의미에서든 TCP는 성능 애플리케이션의 시작이 아니며 마케팅 소음에 지나지 않습니다.
이 짧은 애니메이션은 제로 복사(또는 헤더 분할) 기술을 활용하지 않는 시스템의 3중 메모리 대역폭 사용량을 보여줍니다. 이와 같은 시스템은 메모리 대역폭이 고갈되면서 데이터 손실을 초래할 수 있습니다. CPU와 메모리가 더 이상의 전송을 허용하지 않을 때 네트워크 카드의 버퍼가 오버플로되면 데이터 손실이 발생합니다. 우연히도 이는 RDMA 지지자들이 전통적인 GigE Vision 및 RDMA의 장단점을 논의할 때 비교하는 것인데 이는 최악의 사례이기 때문에 매우 오해의 소지가 있습니다.
이 짧은 애니메이션은 제로 카피를 사용하는 최적화된 GVSP 기반 시스템의 제로 카피 메모리 대역폭 사용량을 보여줍니다. 이 애니메이션에서는 제로 복사 및 시스템 최적화 덕분에 데이터가 자유롭고 안정적으로 흐르는 것을 볼 수 있습니다.
손실 제로가 중요한 대규모 미디어 및 엔터테인먼트 시장을 위한 ST2110 스트리밍 프로토콜에도 동일한 접근 방식이 사용됩니다. RDMA/RoCEv2는 또한 주요 이점인 제로 복사 전송을 지원합니다. 일부는 이것이 이제 보장된 전송 메커니즘이라고 계속 주장하지만 이는 다시 거짓입니다. 고속에서는 모든 프로토콜에 대해 무손실 시스템을 생성하기 위해 적절한 시스템 설계와 마지닝이 중요하지만 제로 복사가 중요한 첫 번째 단계라는 점에 유의하십시오.
이 짧은 애니메이션은 메모리를 완전히 우회하고 0% 메모리 대역폭 및 0% CPU 사용률을 위해 CPU의 PCIe 엔드포인트만 활용하는 GPU Direct를 사용하는 zero-TRANSFER 프로세스를 보여줍니다.
이 짧은 애니메이션은 모든 처리가 FPGA 카드에서 수행되므로 메모리 대역폭 0% 및 CPU 사용률 0%를 위해 메모리와 CPU를 완전히 우회하는 FPGA 카드 프로세스를 보여줍니다.
이 슬라이드에서는 멀티캐스트 기술에 대한 요점을 강조합니다. GigE Vision+GVSP는 현재 이 기본 네트워킹 기능을 지원하는 유일한 프로토콜입니다. 효율적인 중복성과 분산 처리가 필요한 애플리케이션에서는 다른 표준이 빠르게 무시됩니다.
아래의 짧은 애니메이션은 병렬 처리를 위해 한 카메라의 데이터를 여러 장치로 전송하는 방법을 보여줍니다. 간단한 사용 사례로는 하나의 시스템이 집중적인 계산을 수행하는 동안 별도의 시스템을 사용하여 표시하는 경우도 있습니다.
인터페이스의 융합
이 슬라이드는 제안되거나 승인된 변경 사항이 어떻게 인터페이스 표준을 수렴하는지 보여줍니다. USB는 대부분 동일하지만 지점 간 기술입니다. CXP는 GigE Vision으로 통합되는 이더넷 물리 계층을 채택했습니다. GigE Vision+RDMA 및 GigE Vision+TCP(비준된 경우)는 지점 간 기술로서 CXP 및 USB로 통합됩니다. (아마도 2년 정도). GigE Vision+GVSP는 무결성과 기능 세트를 유지하며 다른 프로토콜과 통합되지 않습니다.
프로토콜 조각화
GigE Vision 이미지 전송을 위해 TCP 및 RDMA를 사용하게 되면서 일부 카메라 제공업체의 경우 이러한 다양한 프로토콜을 사용하면 다양한 제3자 업체가 업계 전반에 걸쳐 다양한 NIC와 드라이버를 지원해야 하는 단편적인 환경이 조성되고 있음을 알 수 있습니다. 파티. 최고의 성능을 갖춘 Emergent는 인터페이스의 모든 속도에서 현재 프로토콜을 유지할 수 있으며 요구 사항을 지원하기 위해 다른 프로토콜과 NIC를 사용하지 않습니다.
재전송 기술
TCP 및 RoCEv2에서 패킷 재전송이 사용되는 이유와 지터 및 대기 시간에 미치는 영향은 무엇입니까? 시스템이 제대로 설계 및 조정되지 않은 경우 재전송이 아무리 많아도 시스템이 안정적인 방식으로 실행될 수 없으며 실제로 패킷과 프레임이 삭제됩니다. 또한 잘못된 시스템 설계로 인해 이미지 전송 대역폭이 느려지면 버퍼가 가득 차게 됩니다. 버퍼가 가득 찬 정도는 시스템 대기 시간을 측정하는 것입니다. 버퍼를 채우고 비우는 것은 시스템 지터의 척도입니다. 지터와 대기 시간은 모두 머신 비전 시스템에서 중요합니다. 특히 시기적절한 결정을 내려야 하는 시스템에서는 안전 여유가 부족하거나 전혀 없는 불안정한 시스템의 신호입니다.
FPGA 옵션 RDMA/RoCEv2 및 GVSP
우리가 볼 수 있는 것은 RoCEv2를 구현하려면 더 많은 FPGA 리소스가 필요하므로 FPGA 비용은 경량 표준 및 성숙한 GigE Vision GVSP 프로토콜보다 높을 것이라는 점입니다. 재전송 버퍼가 구현된 경우에는 더욱 그렇습니다.
우리는 가장 작고 저렴한 카메라를 만들기 위해 다양한 제조업체의 이러한 카메라가 2GigE 미만의 RoCEv10를 지원하지 않는다는 것을 확인했습니다. 이는 Emergent의 새로운 Eros가 5GigE 카메라 나머지는 Emergent ZERO 복사 방법의 3배 메모리 대역폭과 33% 효율성을 제공하는 TCP 및 기존 GVSP 처리에 의존하는 반면 계속해서 진정한 ZERO 복사 성능을 제공할 것입니다. ~ 안에 다중 카메라 시스템, Emergent는 시스템 밀도와 가격 성능 지표에서 타의 추종을 불허할 것입니다.
그리고 많은 사람들이 CPU 사용률이 낮다고 말하지만 실제로는 백그라운드에 숨어 최대 시스템 성능을 방해하는 것은 메모리 대역폭 사용률이라는 점을 기억하십시오.
RoCE 대 GVSP
이 요약은 Emergent를 사용한 RDMA/RoCEv2 및 GVSP 성능 구현의 현재 환경을 포착합니다.
질문 게시판
1. ROCEv2가 표준의 일부가 되고 RoCE가 GVSP/Emergent보다 더 유연하다면 Emergent는 어떻게 합니까?
RoCEv2는 슬램덩크가 아닙니다. 모든 데이터의 무게를 측정한 후 유일한 이점은 제로 복사 구성 요소입니다.
그러나 CXP/USB와 같은 지점 간 연결 특성으로 인해 멀티캐스팅과 같은 기본 기능이 제거됩니다. Windows/NVidia용 GPU 다이렉트 없음 NDSPI/Windows 클라이언트 Intel/Marvell 없음. 이점으로 예상되는 것은 프로토콜을 지원하는 NIC 공급자의 포괄적인 목록입니다…
FPGA 리소스는 10G 이상으로 제한됩니다.
재전송/흐름 제어를 통한 지터/지연
표준화되지 않음
성숙하지 않음
느린 채택
기존 1G/2.5/5G와 하위호환 불가
POE 카드 없음
스트리밍 비디오가 아닌 대용량 파일 전송을 위해 설계됨
우리는 이것이 어디로 가는지 볼 것입니다. 모든 제품 응급 공급 장치는 RDMA/RoCEv2를 지원하며 CXP가 급하게 상황에 처할 경우 이를 신속하게 채택할 수 있으며 이제 Eth의 물리적 계층을 채택해야 합니다.
2. 단일 서버에 여러 대의 카메라를 두는 것이 합리적이며 서버가 처리 요구 사항을 어떻게 따라갈 수 있습니까?
eCapture Pro 플러그인 기능으로 H.48 인코딩을 수행하는 25개의 GPU가 있는 단일 서버에 최대 2개의 265Gige 카메라를 보여주는 다른 프레젠테이션을 참조하세요. NVidia의 GPU Direct 및 고성능 GPU 덕분에 패턴 일치, 극성화 및 추론과 같은 다른 플러그인도 성능을 발휘하여 실행할 수 있는 방법을 보여줍니다.
3. 어떤 Broadcom NIC를 지원합니까?
최적의 리소스를 갖춘 P425G(Quad 10/25) 및 P2100G(Dual 100G)와 같은 Broadcom Thor 기반 카드를 지원합니다.
4. 머신 비전 애플리케이션에서 멀티캐스트 기술이 중요합니까?
전적으로. 중복성, 신속한 장애 조치 및 분산 처리의 이점을 누릴 수 있는 모든 시스템은 이점을 얻을 수 있으며 이는 고성능 카메라 시스템에서 더욱 중요해질 것입니다.
5. 우리는 워크스테이션당 5개의 1GigE 카메라로 시스템을 테스트했지만 결코 안정적인 수준에 도달하지 못했습니다. 당신의 프레젠테이션을 보면 당신의 접근방식이 다른 접근방식과 어떤 차이가 있나요?
우리의 초점은 인터페이스 속도에 관계없이 항상 성능 시스템에 있었습니다. 이는 단일 서버에 몇 개의 100GigE 카메라가 될 수도 있고 여러 개의 저속 카메라가 될 수도 있습니다.
동일한 단일 서버에 있는 카메라. 두 경우 모두 우리는 항상 그러한 성능 애플리케이션을 위한 제로 복사 솔루션을 제공하고 10년이 넘는 시스템 성능 조정 경험을 활용해 왔습니다.
6. 귀하가 홍보하는 48포트 25G 스위치의 가격은 얼마입니까?
이에 대한 절대 수치를 제공하지는 않겠지만 경쟁업체에서는 이 스위치가 실제보다 3배 더 비싸다고 말한 것으로 인용하고 있습니다.
일반적으로 스위치 비용은 카메라 두 대만큼 저렴하며 시스템에서 8개 이상의 카메라를 사용할 때 놀라운 가치를 발휘합니다.
응급 비전 기술 정보
다음은 Emergent의 모든 내용을 요약한 것입니다.
- 고속 GigE Vision 이미징 운동의 혁신과 개척에 대한 10개 이상의 상
- 10년 이상 배송 10GigE 140개 이상의 모델이 있는 카메라
- 5년 이상 배송 25GigE 55개 이상의 모델이 있는 카메라
- 2년 이상 배송 100GigE 16개 이상의 모델이 있는 카메라
- 카메라 기술 성능 리더
- 고속 이더넷/GigE Vision에 중점
- 고속 이미지 데이터 처리 가능에 집중
- 영역 스캔 하고 라인 스캔 모델
- 다중 스펙트럼 응용 분야를 위한 UV, NIR, Polarized, Color, Mono 모델
- 완전한 애플리케이션 유연성을 위한 Emergent eSDK
- 나타나는 eCapture 프로 고도로 포괄적인 소프트웨어 솔루션
- 고속 이미징 애플리케이션을 위한 가장 포괄적인 범위의 제품 및 지원
- 모든 속도, 모든 해상도, 모든 케이블 길이
- 지금 사용 가능합니다!
우리는 고속 GigE Vision 제품에 중점을 두고 여러 상을 수상한 회사입니다.
우리는 수년 동안 다양한 속도의 제품을 배송했습니다. 10GigE ~까지 100GigE.
우리는 엔드투엔드 기술을 제공하고 고객 애플리케이션을 지원하는 데 중점을 두고 있습니다.
대부분의 애플리케이션 요구 사항을 충족할 수 있습니다.
마지막으로, 제시된 제품은 현재 구매 가능합니다.
10GigE Vision 이상 채택
다음은 다양한 속도의 GigE Vision 제품 채택에 대한 간략한 스냅샷입니다. 10GigE ~까지 100GigE. Emergent는 최고의 성능을 달성할 수 있는 방법을 보여주었고 이러한 기술을 사용하여 머신 비전을 포함한 많은 시장을 열었습니다. 일부 회사는 이제 막 25G 및 더 빠른 속도의 제품을 출시하기 위한 우리의 노력을 활용하고 있지만 여전히 비준 및 성능 제품을 출시할 방법은 남아 있습니다.
그림: Emergent Vision Technologies는 10GigE, 25GigE, 50GigE 및 100GigE 인터페이스를 기반으로 하는 최초의 카메라 제공업체입니다.