Portal tecnológico

Portal tecnológico

Introducción a la visión artificial

¿Qué es la visión artificial?

La visión artificial se puede definir como una colección de tecnologías de hardware y software que equipan a las máquinas con capacidades de adquisición de imágenes y les permiten automatizar su toma de decisiones. En palabras simples, la visión artificial se refiere al reemplazo de la visión y la inteligencia humanas mediante iluminación, lentes, cámaras y computadoras.

Si bien la visión humana es buena para analizar cualitativamente una escena, la visión artificial sobresale en el aspecto cuantitativo. La capacidad de capturar y cuantificar una escena hace que la visión artificial sea una alternativa adecuada a la visión humana para aplicaciones que requieren:

  • Inspección de pequeños detalles.
  • Contacto no físico
  • Mejor seguridad
  • Mayor productividad
  • Precisión mejorada
  • Automatización de tareas repetitivas.
  • Funcionamiento en entornos peligrosos

En comparación con los sistemas de visión que se implementan en aplicaciones de consumo, por ejemplo, cámaras de teléfonos inteligentes y cámaras de apuntar y disparar, los sistemas de visión artificial son:

  • Muy alta velocidad (FPS)
  • Componente configurable
  • API programable
  • Extremadamente robusto
  • Mecánicamente confiable
  • Y estable en temperaturas extremas

Durante la última década, los sistemas de visión artificial han experimentado un crecimiento explosivo no solo en términos de su capacidad y complejidad, sino también en términos de su adopción más amplia en aplicaciones de fabricación y no fabricación. Según la firma global de asesoría de mercado tecnológico ABI Research, los envíos totales de sistemas de visión artificial alcanzarán los 16.9 millones para 2025, lo que creará una base instalada de 94 millones de sistemas de visión artificial en la fabricación industrial.

Bloques de construcción de un sistema de visión artificial

Un sistema que aprovecha las tecnologías de visión artificial se compone principalmente de cuatro bloques principales:

  1. Adquisición de imágenes: en el centro de la visión artificial se encuentra la capacidad de detectar visualmente una escena y convertirla a un formato digital. Los sensores de imagen junto con las lentes pueden capturar luz, convertir fotones en electrones y generar una imagen digital. Este proceso de convertir una escena en una imagen digital a menudo se denomina adquisición de imágenes. Los sensores de imagen y los componentes electrónicos de apoyo generalmente se alojan dentro de una carcasa protectora que llamamos cámara.
  1. Entrega de datos: una vez que un sensor ha adquirido una imagen y la ha empaquetado en un formato digital, que se denomina "formato de píxel", se envía a un dispositivo informático externo para su posterior procesamiento. Aquí hay una lista de algunos estándares que ha desarrollado la industria de la visión artificial para la entrega de datos:
    • Enlace de cámara
    • CoaXpress
    • Gige visión
    • Visión USB3
    • MIPI
    • IIDC2
  1. Extracción de información: después de que un dispositivo informático recibe una imagen sin procesar de un sensor, se procesa previamente y se analiza en busca de características como:
    • Detección de bordes
    • La coincidencia de patrones
    • Clasificación
    • Segmentación
    • Measurement
    • Conteo de piezas
    • Reconocimiento y ubicación de objetos
    • Reconocimiento de caracteres
    • Lectura de códigos de barras
  1. Toma de decisiones: utilizando la información extraída, un algoritmo generalmente entrenado usando AI/ML/DL* realizaría la toma de decisiones y enviaría la salida de control a una máquina.
Figura-4-escala

Visión artificial frente a visión artificial

Los términos "Visión artificial" y "Visión artificial" se utilizan a menudo cuando hay una discusión sobre imágenes, por lo que es importante que entendamos el significado detrás de ellos y aclaremos cualquier concepto erróneo.

Visión de máquina Visión por computador
El término "Visión artificial" se utiliza principalmente en el contexto de la automatización industrial. El término "Visión por computadora" se usa principalmente en el contexto del aprendizaje profundo/inteligencia artificial
La visión artificial se asocia principalmente con el preprocesamiento de imágenes y la extracción de características basada en reglas. Computer Vision se asocia principalmente con el procesamiento posterior de imágenes y la extracción de características basadas en el aprendizaje.
La visión artificial siempre involucra un sistema de cámara para capturar imágenes y entregar datos Los sistemas de cámara pueden o no estar involucrados
La visión artificial puede o no involucrar el procesamiento de GPU y la computación en la nube Los modelos grandes de visión por computadora a menudo requieren procesamiento de GPU y computación en la nube
El objetivo de la visión artificial es permitir que las máquinas automaticen su toma de decisiones mediante la detección visual de su entorno. El objetivo de la visión por computadora es entrenar un modelo de IA aprendiendo características de un conjunto de imágenes y luego hacer predicciones.

Está claro que aunque tanto la visión artificial como la visión por computadora implican el procesamiento de imágenes, sus objetivos son diferentes. La visión artificial no es necesariamente un subconjunto de la visión por computadora y la visión por computadora no es necesariamente un subconjunto de la visión artificial, pero los sistemas de visión artificial a menudo utilizan herramientas de visión por computadora para obtener información significativa para su proceso de toma de decisiones. Se deben considerar una variedad de factores antes elegir una cámara de visión artificial o un cámara de visión por computadora.