Portal tecnológico

Portal tecnológico

Tecnologías de rendimiento: UDP de copia cero frente a RDMA/RoCEv2

Los sistemas de rendimiento pueden estar compuestos por muchos cámaras 25GigE hablando con algunos servidores con funciones de multiplexación y PTP utilizadas por empresas de bajo costo interruptores.

Los sistemas de rendimiento también pueden estar compuestos por un número menor de cámaras 100GigE que se comunican con unos pocos servidores con las mismas funciones de multiplexación y PTP utilizadas por los conmutadores de bajo costo.

Los sistemas de rendimiento también pueden estar compuestos por un gran número de 5GigE o incluso cámaras GigE que se comunican con un único servidor con funciones de multiplexación y PTP utilizadas por conmutadores de costos aún más bajos. Descubrimos que este es un problema para los fabricantes de cámaras de baja velocidad, por lo que aprovechamos nuestra experiencia en sistemas de alto rendimiento para brindar la mejor densidad de sistema de su clase junto con el menor costo del sistema con la introducción de Emergent. Cámaras Eros 5GigE.

NIC compatibles

Además, de un potente motor de procesamiento. tarjetas de interfaz de red (NIC) como el AMD Alveo Tarjetas y NIC basadas en FPGA propias de Emergent para una funcionalidad adicional más allá de las NIC estándar, fuimos pioneros en el uso de NIC Mellanox para usar con sistemas de cámara de alto rendimiento. Ahora tenemos soporte para equivalente NIC de Broadcom para abordar mercados sensibles a los costos. Se admiten 100GigE, 25GigE y 10GigE, teniendo en cuenta que 5GigE e inferiores también son compatibles para proporcionar los mismos beneficios de rendimiento para sistemas con un número de cámaras medio a alto mediante el uso de conmutadores de bajo costo. Con las opciones de procesamiento de alto rendimiento disponibles en GPU y tarjetas FPGA, se puede crear el sistema de menor costo y mayor densidad de la industria.
NIC compatibles

Implementación de la visión GigE

Ahora profundizaremos para comprender qué se debe buscar en una actuación. GigE Vision implementación. Esta breve animación ilustra el proceso de dividir los paquetes de red GigE Vision en imágenes. Los encabezados, líderes y avances son consumidos por un proceso de control mientras que las partes de la imagen terminan en un búfer de memoria contiguo. Cuando se utiliza software para este proceso, todo el paquete se escribe en la memoria y luego las partes de la imagen deben leerse de la memoria y volver a escribirse en otra ubicación de la memoria de forma no fragmentada (o contigua). Este proceso se puede realizar en un software que cuesta 3 veces el ancho de banda de la memoria o se puede realizar mediante las funciones de división del encabezado de la tarjeta para un rendimiento óptimo. GigE Vision y TCP convencionales son ejemplos de procesos de bajo rendimiento. Y no se deje engañar por las afirmaciones sobre el mecanismo de transferencia garantizada de algunos implementadores de TCP, que simplemente significan que si recibe una trama, esta trama estará completa sin ningún tipo de corrupción. Esto no es una garantía de que no se perderán fotogramas. En todos los sentidos, TCP no es un punto de partida para las aplicaciones de rendimiento y equivale a poco más que ruido de marketing.

Esta breve animación ilustra el uso triple del ancho de banda de la memoria de un sistema que no utiliza tecnología de copia cero (o división de encabezados). Un sistema como este puede provocar la pérdida de datos a medida que se agota el ancho de banda de la memoria. La pérdida de datos ocurre cuando el búfer de la tarjeta de red se desborda cuando la CPU y la memoria no permiten más transferencias. Esto, dicho sea de paso, es con lo que los defensores de RDMA comparan cuando discuten los pros y los contras de GigE Vision y RDMA tradicionales, lo cual es muy engañoso ya que este es el peor ejemplo de los casos.

Esta breve animación ilustra el uso del ancho de banda de la memoria de copia cero de un sistema optimizado basado en GVSP que utiliza copia cero. Vemos en esta animación que los datos fluyen de forma libre y confiable gracias a la optimización del sistema y la copia cero.
El mismo enfoque también se utiliza para el protocolo de transmisión ST2110 para el mercado masivo de medios y entretenimiento, donde la pérdida cero también es fundamental. RDMA/RoCEv2 también admite la transferencia sin copia, que es su principal beneficio. Algunos seguirán afirmando que ESTE es ahora el mecanismo de transferencia garantizado, lo cual nuevamente es falso. A alta velocidad, el diseño y los márgenes adecuados del sistema son importantes para crear un sistema de pérdida cero para cualquier protocolo, pero observamos que la copia cero es el primer paso fundamental.

Esta breve animación ilustra el proceso de TRANSFERENCIA cero utilizando GPU Direct, que omite completamente la memoria y utiliza solo los puntos finales PCIe de la CPU para un 0 % de ancho de banda de memoria y un 0 % de utilización de la CPU.

Esta breve animación ilustra el proceso de la tarjeta FPGA que omite completamente la memoria y la CPU para obtener un 0 % de ancho de banda de memoria y un 0 % de utilización de la CPU, ya que todo el procesamiento se realiza en la tarjeta FPGA.

Esta diapositiva destaca el punto sobre las tecnologías de multidifusión. GigE Vision+GVSP es actualmente el ÚNICO protocolo que admite esta función de red fundamental. Otros estándares serán rápidamente descartados en aplicaciones que requieran redundancia eficiente y procesamiento distribuido.

multidifusión

Esta breve animación a continuación ilustra cómo los datos de una cámara se pueden enviar a múltiples dispositivos para su procesamiento en paralelo. Un caso de uso simple podría ser incluso el de utilizar un sistema separado para la visualización mientras un sistema realiza cálculos intensos.

Convergencia de las Interfaces

Esta diapositiva es una ilustración de cómo los cambios propuestos o ratificados están haciendo converger los estándares de interfaz. USB sigue siendo prácticamente el mismo, pero es una tecnología punto a punto. CXP ha adoptado la capa física de Ethernet convergiendo hacia GigE Vision. GigE Vision+RDMA y GigE Vision+TCP (si se ratifican) están convergiendo a CXP y USB como tecnología punto a punto. (quizás dentro de 2 años). GigE Vision+GVSP mantendrá su integridad y conjunto de funciones y no convergerá con los otros protocolos.

convergencia de las interfaces

Fragmentación del protocolo

Con la introducción del uso de TCP y RDMA para la transmisión de imágenes GigE Vision, vemos que para algunos proveedores de cámaras, el uso de estos diferentes protocolos está creando un panorama fragmentado en el que diferentes NIC y controladores necesitarán ser compatibles en toda la industria por parte de varios terceros. fiestas. Con un rendimiento superior, Emergent puede mantener el protocolo actual en todas las velocidades de interfaz y no tener que recurrir a diferentes protocolos y NIC para satisfacer sus necesidades.

udp gvsp frente a udp tcp rdma 3 udp gvsp frente a udp tcp rdma 2

Reenviar tecnología

¿Por qué se utilizan los reenvíos de paquetes con TCP y RoCEv2 y cuáles son las implicaciones sobre la fluctuación y la latencia? Si un sistema no está bien diseñado y ajustado, ninguna cantidad de reenvíos permitirá que el sistema se ejecute de manera estable y, de hecho, descartará paquetes y tramas. Además, cuando el ancho de banda de transferencia de imágenes se reduce debido a un diseño deficiente del sistema, los buffers se llenan. La plenitud del buffer es una medida de la latencia del sistema. El llenado y vaciado del buffer es una medida de la inestabilidad del sistema. Tanto la fluctuación como la latencia son importantes en los sistemas de visión artificial, especialmente aquellos que necesitan tomar decisiones oportunas, y ambos son una señal de un sistema inestable con un margen de seguridad escaso o nulo.

Opciones de FPGA RDMA/RoCEv2 frente a GVSP

Lo que vemos es que RoCEv2 requiere más recursos FPGA para implementarse y, como tal, el costo de la FPGA será mayor que el del estándar liviano y el protocolo maduro GigE Vision GVSP. Esto es aún más cierto si se implementa un búfer de reenvío.

Vemos que para crear la cámara más pequeña y de menor costo, estas cámaras de varios fabricantes no admiten RoCEv2 por debajo de 10GigE. Ésta es una de las formas en que el nuevo Eros de Emergent cámaras 5GigE continuará brindando un verdadero rendimiento de copia CERO, mientras que los demás dependen del procesamiento TCP y GVSP convencional, que produce un ancho de banda de memoria 3 veces mayor y una eficiencia del 33 % de los métodos de copia Emergent ZERO. En sistemas multicámara, Emergent seguirá siendo incomparable en densidad del sistema y métricas de rendimiento de precios.

Y recuerde que, si bien muchos afirman que la utilización de la CPU es baja, en realidad es la utilización del ancho de banda de la memoria la que se oculta en segundo plano e impide el máximo rendimiento del sistema.

rocev2 vs gvsp 3 rocev2 vs gvsp 2

RoCE y GVSP

Este resumen captura el panorama actual de las implementaciones de rendimiento de RDMA/RoCEv2 y GVSP con Emergent

resumen de rdma.pptx

Q&A

1. ¿Qué hará Emergent si ROCEv2 forma parte del estándar y RoCE es más flexible que GVSP/Emergent?

RoCEv2 no es un fracaso. El único beneficio después de sopesar todos los datos es el componente de copia cero.

Y, sin embargo, elimina una característica fundamental como la multidifusión debido a su naturaleza de conexión punto a punto como CXP/USB. Sin GPU Direct para Windows/NVidia Sin NDSPI/Windows Client Intel/Marvell. Lo que se suponía que era un beneficio es la lista completa de proveedores de NIC que admiten el protocolo….

Recursos FPGA para limitar a 10G y más
Jitter/Latencia con reenvíos/control de flujo
no estandarizado
no maduro
Adopción lenta
No es compatible con versiones anteriores de 1G/2.5/5G existentes
Sin tarjetas POE
Diseñado para transferencias de archivos grandes, no para transmisión de video

Veremos adónde va esto; todos los productos Los suministros emergentes están preparados para RDMA/RoCEv2 y podrían adoptarlo rápidamente si CXP se apresurara a hacerlo, y ahora debe adoptar la capa física de Eth

2. ¿Es razonable tener muchas cámaras en un solo servidor y cómo puede el servidor satisfacer las necesidades de procesamiento?

Consulte nuestra otra presentación donde mostramos hasta 48 cámaras 25Gige en un solo servidor con 2 GPU que realizan codificación H.265 con nuestra función de complemento eCapture Pro. Mostraremos cómo otros complementos, como la coincidencia de patrones, la polarización y la inferencia, también se pueden ejecutar con rendimiento gracias a GPU Direct y las GPU de alto rendimiento de NVidia.

3. ¿Qué NIC de Broadcom admite?

Admitimos tarjetas basadas en Broadcom Thor como P425G (Quad 10/25) y P2100G (Dual 100G) que tienen recursos óptimos

4. ¿Es importante la tecnología de multidifusión en las aplicaciones de visión artificial?

Absolutamente. Cualquier sistema que pueda beneficiarse de la redundancia, la conmutación por error rápida y el procesamiento distribuido se beneficiará y eso sólo será más importante con sistemas de cámaras de mayor rendimiento.

5. Probamos un sistema con 5 cámaras 1GigE por estación de trabajo y nunca lo llevamos a un nivel estable. Viendo tu presentación, ¿cuál es la diferencia entre tu enfoque y el de otros?

Nuestro enfoque siempre ha estado en los sistemas de rendimiento independientemente de la velocidad de la interfaz. Podrían ser unas pocas cámaras de 100GigE en un solo servidor o muchas de menor velocidad.
cámaras en el mismo servidor único. En cualquier caso, siempre proporcionamos una solución de copia cero para dichas aplicaciones de rendimiento y contamos con más de una década de ajuste del rendimiento del sistema que aprovechamos.

6. ¿Cuál es el precio de un conmutador 48G de 25 puertos como el que promociona?

No proporcionaré números absolutos para esto, pero diré que se ha citado a nuestros competidores diciendo que estos conmutadores son 3 veces más caros que la realidad.
En general, los conmutadores pueden costar tan solo un par de cámaras, lo que tiene un valor increíble cuando se trabaja con 8 o más cámaras en un sistema.

Emergent es socio de NVidia y trabaja con la tecnología NVidia y Mellanox desde 2015

Acerca de las tecnologías de visión emergentes

logo tecnologías de visión emergente 300x110

Aquí hay un resumen de lo que se trata Emergent...

  • Más de 10 premios por innovación y ser pioneros en el movimiento de imágenes GigE Vision de alta velocidad
  • 10+ años de envío 10GigE cámaras con más de 140 modelos
  • 5+ años de envío 25GigE cámaras con más de 55 modelos
  • 2+ años de envío 100GigE cámaras con más de 16 modelos
  • Líder en rendimiento de tecnología de cámaras
  • Centrado en Ethernet de alta velocidad/GigE Vision
  • Enfocado en permitir el procesamiento de datos de imagen de alta velocidad
  • Escaneo de área y Escaneo de línea modelos
  • Modelos UV, NIR, Polarizados, Color, Mono para aplicaciones multiespectrales
  • eSDK emergente para una flexibilidad total de aplicaciones
  • Emergente ecaptura profesional para una solución de software muy completa
  • La gama más completa de productos y soporte para aplicaciones de imágenes de alta velocidad
  • Cualquier velocidad, cualquier resolución, cualquier longitud de cable
  • ¡Disponible ahora!

Somos una empresa ganadora de múltiples premios centrada en el producto GigE Vision de alta velocidad.

Tenemos muchos años enviando productos que varían en velocidades desde 10GigE hasta 100GigE.

Tenemos un fuerte enfoque en proporcionar tecnologías de extremo a extremo y soporte para las aplicaciones de nuestros clientes.

Podemos satisfacer la mayoría de las necesidades de las aplicaciones.

Por último, los productos presentados ya están disponibles.

Adopción de 10GigE Vision y superior

A continuación se ofrece un breve resumen de la adopción de productos GigE Vision que varían en velocidades desde 10GigE hasta 100GigE. Emergent ha demostrado cómo se puede lograr el máximo rendimiento y abrió muchos mercados, incluida la visión artificial, para el uso de tales tecnologías. Algunas empresas ahora están aprovechando nuestros esfuerzos para lanzar productos de 25G y de mayor velocidad, pero aún queda mucho camino por recorrer para lanzar productos ratificados y de rendimiento.

Adopción de 10GigEVision y superior

Figura: Emergent Vision Technologies es el primer proveedor de cámaras basadas en interfaces 10GigE, 25GigE, 50GigE y 100GigE.