Estudio de caso: el aprendizaje profundo y las cámaras de alta velocidad ayudan a rastrear grandes colectivos de animales sin marcar

Descubra cómo nuestra cámara 10GigE con sensor CMOS de 20MP ayudó a un sistema de imágenes basado en aprendizaje profundo a comprender los patrones de movimiento colectivo de animales sin marcar. La herramienta idtracker.ai rastreó un gran colectivo de hasta 100 peces cebra juveniles con un 99.9 % de precisión.

idtracker.ai es una herramienta diseñada para identificar y rastrear la posición de cada individuo en un colectivo sin importar la especie o el tamaño de los animales

Los animales se estudian por múltiples razones, ya sea para investigación médica o para obtener una comprensión más profunda de su comportamiento. El pez cebra, en particular, se estudia comúnmente debido a su disponibilidad, pero también porque comparte el 70% de los genes con los humanos y tiene una estructura genética similar a la nuestra. El 84% de los genes que se sabe que están asociados con una enfermedad humana tienen una contraparte de pez cebra.

Pero, ¿cómo rastrear o estudiar grandes comunidades de animales más pequeños?

idtracker.ai basado en visión artificial

Creado por el equipo del Laboratorio de Comportamiento Colectivo de Champalimaud Research en Lisboa, Portugal, idtracker.ai es una herramienta diseñada para identificar y rastrear la posición de cada individuo en un colectivo, independientemente de la especie o el tamaño de los animales. En este caso, idtracker.ai puede rastrear un gran colectivo de animales de hasta 100 peces cebra juveniles con un 99.9 % de precisión. El sistema también puede rastrear individuos solteros. Para ello, el sistema utiliza dos redes profundas. Uno que detecta cuando los animales se tocan o se cruzan, y otro para identificar a cada individuo.

La puesta en marcha

El sistema consta de un depósito a medida de 70 cm de diámetro con sistema de recirculación de agua. El tanque se coloca dentro de una caja construida con paredes de acrílico blanco mate con una puerta para permitir un fácil acceso.

El aprendizaje profundo y las cámaras de alta velocidad ayudan a rastrear grandes colectivos de animales sin marcar

Una cámara monocromática HT-20000 de Emergent Vision Technologies que utiliza una lente ZEISS Distagon de 28 mm se coloca a 70 cm por encima de la superficie del tanque. La HT-20000 es una cámara de 20 megapíxeles con el sensor CMOS CMV20000 de AMS. Su interfaz RJ45 10GBaseT de alta velocidad ofrece una solución rentable para muchas aplicaciones y longitudes de cable de hasta 100 metros. Las tiras de LED infrarrojos y RBG y un difusor de luz retráctil cilíndrico ubicado alrededor de la cámara brindan una iluminación homogénea. Los videos se graban usando computadoras de escritorio con 2 TB en RAID 0 con Windows 10 de 64 bits con el software NorPix StreamPix.

Detección e identificación de personas

Idtracker.ai utiliza dos redes neuronales convolucionales profundas (CNN). Uno para detectar cuando los animales se tocan o cruzan (detector de cruce profundo) y un segundo para identificar animales (red de identificación).

El aprendizaje profundo y las cámaras de alta velocidad ayudan a rastrear grandes colectivos de animales sin marcar

El sistema inicia el proceso capturando datos de imagen dentro de un rango entre 25 y 50 cuadros por segundo. Esto permite que el sistema recopile imágenes pertenecientes a la misma persona y las organice en fragmentos para un seguimiento e identificación precisos sin sobrecargar el sistema con datos de imágenes redundantes.

Las imágenes que representan animales individuales o múltiples que se tocan se extraen del video. Cada imagen está etiquetada como un solo individuo o como un cruce. Los grupos de imágenes en fotogramas posteriores del video en los que se representa al mismo individuo (o cruce) se denominan fragmentos individuales y de cruce, respectivamente. idtracker.ai rastrea a las personas basándose en sus características visuales.

“El principal desafío para nosotros fue rastrear con precisión a cada uno de los individuos. Queríamos registrar un gran grupo de juveniles de pez cebra con una densidad de animales lo suficientemente baja como para permitir que el grupo expresara una gama diferente de comportamientos. Por lo tanto, necesitábamos cubrir un área grande en proporción al tamaño real de los animales. Aquí es cuando tener una cámara de alta resolución resultó útil. Con los 20 megapíxeles del HT-20000-M pudimos cubrir un área amplia y aún tener suficientes píxeles por animal para que idtracker.ai funcione”, dice Francisco Romero-Ferrero, estudiante de doctorado en el Laboratorio de comportamiento colectivo, Champalimaud Research.

Un subconjunto de la colección de fragmentos individuales, en el que todos los individuos son visibles en la misma parte del video, se utiliza para generar un conjunto de datos de imágenes individuales etiquetadas con las identidades correspondientes. Este conjunto de datos luego se utiliza para entrenar una segunda CNN para clasificar las imágenes según su identidad (red de identificación).

La información obtenida del primer conjunto de datos de imágenes etiquetadas permitirá asignar con precisión la colección completa de fragmentos individuales o aumentar el primer conjunto de datos incorporando fragmentos individuales identificados de forma segura a lo largo del video. Finalmente, los errores de identificación triviales se corrigen mediante una serie de rutinas de posprocesamiento, y la identidad de los fragmentos cruzados se infiere en un último núcleo computacional.