IA INDUSTRIAL: CÓMO EL APRENDIZAJE PROFUNDO COMPLETA LOS SISTEMAS DE VISIÓN MÁQUINA

Dentro del ámbito de la automatización industrial, la inteligencia artificial (IA) se ha convertido en una palabra de moda. Dejando a un lado las exageraciones, la IA se ha hecho un hueco en el espacio industrial, ofreciendo un valor tremendo en la planta cuando se diseña e implementa correctamente. El aprendizaje profundo, un subconjunto de la IA que utiliza redes neuronales como las redes neuronales convolucionales (CNN) que imitan el proceso de aprendizaje del cerebro humano, se ha convertido en una herramienta de IA industrial popular por su capacidad para ayudar en las decisiones de inspección subjetiva y en la inspección de escenas. donde la identificación de características específicas resulta difícil debido a la alta variabilidad o complejidad. 

Cuando se trata de elegir una solución de aprendizaje profundo, los fabricantes tienen varias opciones, incluida la programación de una solución interna, aprovechando marcos establecidos como PyTorch o TensorFlow. Los fabricantes también tienen la opción de comprar una solución disponible en el mercado u optar por un sistema o producto habilitado para IA para aplicaciones específicas. 

Sin embargo, el aprendizaje profundo no es una tecnología independiente. Más bien, cuando se implementa junto con los tradicionales máquina vision técnicas, se convierte en una poderosa herramienta para la inspección automatizada que mejora las capacidades generales de los sistemas de automatización industrial implementados en aplicaciones que incluyen inspección de electrónica y semiconductores, inspección de bienes de consumo empaquetados e inspección de automóviles.

Aplicaciones
  • Inspección de semiconductores/electrónica

  • inspección de soldadura

  • Inspección médica/farmacéutica

  • Recogida de contenedores/pick-and-place robótico

  • Inspección automotriz

  • IA y aprendizaje profundo hermoso,hombre,computadora,ingeniero y científicos,crear,red neuronal,en

APRENDIZAJE PROFUNDO: UNA HERRAMIENTA PARA LA CAJA DE HERRAMIENTAS DE LA VISIÓN MÁQUINA

La visión artificial se refiere a un conjunto de hardware, que incluye cámaras, óptica e iluminación, que, junto con la adecuada software, ayuda a las empresas a ejecutar ciertas funciones basadas en el análisis de imágenes realizado por el sistema de visión artificial. Las cuatro categorías principales de aplicaciones de visión artificial son inspección, identificación, guía y medición, y en el corazón de todos los sistemas se encuentra el software, que ayuda a impulsar la capacidad, confiabilidad y usabilidad de los componentes.

El software de visión artificial tradicional se refiere a algoritmos discretos basados ​​en reglas capaces de realizar una cantidad significativa de tareas de imágenes automatizadas. Ejemplos de algoritmos generales de visión artificial incluyen detección de bordes, transformación de imágenes, estadísticas de contenido, correlación, búsqueda geométrica, OCR/OCV y correlación. Cuando se trata de incorporar el aprendizaje profundo en un sistema de visión artificial, es importante recordar que el aprendizaje profundo no se puede implementar en todas las aplicaciones de visión artificial.

En determinadas aplicaciones, por supuesto, el aprendizaje profundo puede llenar los vacíos que los enfoques tradicionales no pueden. Por ejemplo, un sistema de visión artificial que inspecciona una soldadura buscará detalles específicos en la imagen de la soldadura, pero como cada soldadura es única, es difícil para el software definirla algorítmicamente. El aprendizaje profundo, por otro lado, puede identificar características que son más subjetivas, similares a cómo una persona inspeccionaría una soldadura. Una soldadura ligeramente amorfa que no se ve igual que una imagen dorada no necesariamente equivale a una soldadura defectuosa.

red neuronal artificial profunda, esquema

Fig 1: Siguiendo el modelo del cerebro humano, las redes neuronales son un subconjunto del aprendizaje automático en el corazón de los algoritmos de aprendizaje profundo que permiten que una computadora aprenda a realizar tareas específicas basadas en ejemplos de entrenamiento.

Para que el aprendizaje profundo alcance cualquier nivel de éxito se requiere la creación de un conjunto de datos de alta calidad. Los fabricantes pueden crear un conjunto de datos inicial cargando imágenes que muestren clases de defectos o características que deben detectarse junto con las "buenas imágenes". Un equipo de expertos en la materia puede etiquetar el conjunto de datos inicial y entrenar el modelo, validar los resultados con imágenes de prueba del conjunto de datos original, probar el rendimiento en producción y volver a entrenar el modelo para cubrir nuevos casos, características o defectos. Una vez hecho esto y considerados todos los factores para la implementación del aprendizaje profundo en un sistema de visión artificial, el software puede comenzar a ayudar con la detección de defectos, la clasificación de características y la verificación del ensamblaje, así como con la inspección de escenas complejas o altamente variables donde identificar características específicas puede resultar difícil, como la recogida en contenedores con piezas o productos mixtos.

CONSIDERACIONES DE LA CÁMARA DE APRENDIZAJE PROFUNDO

Aunque quizás sea un cliché, es cierto que cuando se trata de desarrollar una aplicación de aprendizaje profundo, es "basura que entra, basura sale". Al igual que los enfoques tradicionales de visión artificial, las aplicaciones de aprendizaje profundo no pueden superar la mala iluminación o el diseño óptico y aún requieren imágenes de alta calidad para crear un conjunto de datos de calidad para entrenamiento y etiquetado. Esto significa implementar una configuración de iluminación óptima para proporcionar suficiente contraste en las imágenes o, en algunos casos, un esquema de iluminación especializado. Por ejemplo, ciertas aplicaciones pueden requerir múltiples inspecciones en una sola pieza, lo que significa diferentes configuraciones de iluminación para cosas como presencia/ausencia o verificar el tamaño o la forma de un objeto.

Por supuesto, si bien la iluminación es fundamental para el éxito en cualquier aplicación de visión artificial o aprendizaje profundo, el sistema gira en torno a la capacidad de la cámara para capturar imágenes a las velocidades y resoluciones necesarias. Las imágenes deben tener la resolución correcta para la aplicación de destino con el mejor contraste de características posible, pero también se deben tener en cuenta otras limitaciones y consideraciones de la aplicación. Estas incluyen el tamaño, el peso, la potencia, la velocidad del objeto del que se está fotografiando, la transmisión frente a la grabación. , color versus monocromo, tamaño mínimo de defecto y campo de visión mínimo.

Las aplicaciones de alta velocidad en las que una parte o un sujeto se mueve muy rápido y requieren que el sistema congele la acción del objeto para analizar los detalles requerirán cámaras de mayor velocidad, mientras que un sistema que requiera altos niveles de detalles requerirá una cámara con una alta velocidad. Sensor de imagen de resolución. Emergent Vision Technologies se especializa en el diseño y desarrollo de sistemas industriales. cámaras de alta velocidad que ofrecen algunas de las velocidades de cuadro y resoluciones más altas disponibles en el mercado de visión artificial actual.

IA y aprendizaje profundo aprendizaje profundo 1

Fig 2: La herramienta intracker.ai identifica y rastrea la posición de animales individuales sin marcar, independientemente de la especie o el tamaño de los animales. En esta aplicación, los investigadores utilizaron cámaras de 20MP 10GigE de Emergent para rastrear un colectivo de 100 peces cebra juveniles con una precisión del 99.9%.

Aprovechando lo establecido GigE Vision y estándares GenICam, Emergentes cámaras de visión artificial se puede integrar perfectamente en aplicaciones de software compatibles sin necesidad de hardware o cableado de adquisición patentado. emergentes 10GigE, 25GigEy cámaras 100GigE Ofrece resoluciones superiores a 100 MP+ y velocidades de cuadro cercanas a 3500 fps para aplicaciones donde se deben generar grandes cantidades de datos y luego transmitirlos de manera rápida y confiable a un dispositivo host, como una PC industrial.

Al utilizar Ethernet como interfaz de conectividad, las cámaras Emergent ofrecen velocidades de conectividad de hasta 100 Gbps sin sacrificar la resolución o las velocidades del sensor. Además, las cámaras se pueden sincronizar mediante IEEE1588 PTP para la captura de imágenes de alta velocidad de un evento a menos de 1 µs sin utilización de CPU y con el mínimo absoluto de utilización de CPU, ancho de banda de memoria, latencia y fluctuación en longitudes de cable de hasta 10 km.

INFERENCIA

El siguiente vídeo muestra con qué facilidad uno puede agregar y probar su propio modelo de inferencia entrenado para realizar la detección y clasificación de objetos arbitrarios. Simplemente entrene su modelo con PyTorch o TensorFlow y agréguelo a su propio complemento eCapture Pro. Luego cree una instancia del complemento, conéctese a la cámara que desee y haga clic en ejecutar; no hay nada más fácil que esto.

Con modelos bien entrenados, las aplicaciones de inferencia se pueden desarrollar e implementar con muchas cámaras Emergent en una sola PC con un par de GPU usando la funcionalidad GPU Direct de Emergent; nadie hace aplicaciones de rendimiento como Emergent.

DESARROLLO DE PLUG-IN PERSONALIZADO

En este breve clip ilustramos el proceso mediante el cual los clientes pueden crear sus propios complementos personalizados que pueden cargarse posteriormente en eCapture Pro y generar resultados en tiempo real. Observamos que cualquier complemento puede alimentar una o varias cámaras para probar el rendimiento total del sistema y lograr la máxima densidad del sistema.

GPUDIRECT: IMAGEN SIN PÉRDIDA DE DATOS

Muchas aplicaciones actuales dependen de las GPU NVIDIA para tareas de aprendizaje profundo con el fin de manejar los requisitos de potencia informática. Las cámaras de visión artificial de Emergent también son compatibles con NVIDIA GPUDirect tecnología, que permite la transferencia de imágenes directamente a la memoria de la GPU. Para un cliente emergente que aprovecha la tecnología GPUDirect, esto significó implementar un sistema basado en Cámaras Bolt HB-12000-SB 25GigE, un servidor y CPU, dos puertos duales 100G tarjetas de interfaz de red (NIC), un conmutador de puerto 24x y dos GPU NVIDIA.

GPU directa

En este sistema, el cliente implementó 24x Cámaras HB-12000-SB, que cuentan con el Sony Pregius S IMX12.4 de 535 MP, que captura imágenes a 60 fps y envía los datos directamente a las GPU, lo que da como resultado imágenes sin pérdida de datos con cero utilización de CPU y cero ancho de banda de memoria. Con Compresión H.265, las imágenes también se pueden almacenar localmente en el disco y transmitirse a clientes del protocolo de mensajería en tiempo real (RTMP) como YouTube. Aprovechar tecnologías de procesamiento innovadoras como GPUDirect permite a los usuarios finales adquirir, transferir y procesar grandes cantidades de datos de forma rápida y eficiente sin preocuparse por la pérdida de fotogramas.

logotipo de pérdida cero

¿Necesita ayuda para encontrar la cámara adecuada?

Póngase en contacto con nosotros hoy mismo y nuestro equipo de profesionales en imágenes estará encantado de ayudarle.

Descargas de recursos

¿Necesitas más información sobre nuestras cámaras? Descargue nuestras hojas de datos de productos, software, informes técnicos, calculadoras de velocidad de fotogramas, dibujos en 3D y más hoy.

CÁMARAS DE VISIÓN GIGE EMERGENTES PARA APLICACIONES DE IA Y APRENDIZAJE PROFUNDO

Modelo Chroma Resolución Cuadros por segundo Interfaz Nombre del sensor Pixel Tamaño
Cámara de escaneo de área HR 1800 SM 1.76MP 10GigE SFP+ HR-1800-SM Mono 1.76MP 660fps SFP+ de 10 Gigas Sony IMX425 9 × 9 µm
Cámara de escaneo de área HR 1800 SC 1.76MP 10GigE SFP+ HR-1800-SC Color 1.76MP 660fps SFP+ de 10 Gigas Sony IMX425 9 × 9 µm
Cámara de escaneo de área HR 5000 SM 5MP 10GigE SFP+ HR-5000-SM Mono 5MP 163fps SFP+ de 10 Gigas Sony IMX250LLR 3.45 × 3.45 µm
Cámara de escaneo de área HR 5000 SC 5MP 10GigE SFP+ HR-5000-SC Color 5MP 163fps SFP+ de 10 Gigas Sony IMX250LQR 3.45 × 3.45 µm
Cámara de escaneo de área HR 12000 SM 12MP 10GigE SFP+ HR-12000-SM Mono 12MP 80fps SFP+ de 10 Gigas Sony IMX253LLR 3.45 × 3.45 µm
Cámara de escaneo de área HR 12000 SC 12MP 10GigE SFP+ HR-12000-SC Color 12MP 80fps SFP+ de 10 Gigas Sony IMX253LQR 3.45 × 3.45 µm
Cámara de escaneo de área HR 25000 SB M 24.47MP 10GigE SFP+ HR-25000-SB-M Mono 24.47MP 51fps SFP+ de 10 Gigas Sony IMX530 2.74 × 2.74 μm
Cámara de escaneo de área HR 25000 SB C 24.47MP 10GigE SFP+ HR-25000-SB-C Color 24.47MP 51fps SFP+ de 10 Gigas Sony IMX530 2.74 × 2.74 μm

Para opciones de cámara adicionales, consulte nuestra herramienta de diseño de sistemas interactivos.