Visión Artificial en condiciones adversas

La Visión Artificial ha emergido como una herramienta invaluable en una variedad de campos, desde la industria manufacturera hasta la medicina y la conducción autónoma. Sin embargo, su eficacia radica en gran medida en la calidad del conjunto de datos utilizado para entrenar los modelos.

A la hora de implementar un sistema de Visión Artificial la primera decisión es elegir qué tecnología de IA emplear. Podemos resumir que las opciones actualmente son Deep Learning, Reinforcement Learning y Deep Reinforcement Learning.

Mientras que el Deep Learning destaca en el procesamiento de grandes conjuntos de datos para tareas de percepción, el Reinforcement Learning y el Deep Reinforcement Learning son más adecuados para problemas de toma de decisiones secuenciales y dinámicos. La elección entre estas técnicas depende de la naturaleza específica del problema y los recursos disponibles para su implementación. La mayoría de implementaciones de Visión Artificial, dadas las características de la inferencia a realizar, suelen basarse en Deep Learning.

En una implementación de Visión Artificial mediante Deep Learning la generación de un dataset robusto y representativo es crucial para garantizar que se pueda realizar inferencias precisas y confiables en situaciones del mundo real.


Sistema de Visión artificial detectando en tipos de vehículos y peatones en tiempo real.

La complejidad de generar un buen dataset radica en varios desafíos. En primer lugar, es necesario recopilar datos que abarquen una amplia gama de escenarios y condiciones, lo que puede requerir una meticulosa planificación y adquisición de imágenes. Además, la anotación precisa de cada imagen con etiquetas relevantes es esencial para el aprendizaje supervisado, pero este proceso puede ser laborioso y propenso a errores humanos.

Una vez generado el dataset, el siguiente paso crucial es el entrenamiento del modelo en la nube. Este enfoque permite aprovechar la potencia de cálculo escalable y los recursos de almacenamiento disponibles en la nube para acelerar el proceso de entrenamiento y optimizar la precisión del modelo. Sin embargo, incluso con un dataset sólido y un entrenamiento en la nube eficiente, la verdadera medida del éxito de un sistema de Visión Artificial radica en su capacidad para realizar inferencias precisas y consistentes en entornos del mundo real, donde factores como la iluminación variable, la obstrucción parcial y la diversidad de objetos presentes pueden desafiar incluso a los sistemas más avanzados. En este artículo, exploraremos en detalle los desafíos y las estrategias para superarlos en cada etapa del proceso, desde la generación del dataset hasta la inferencia en tiempo real.

EQUIP Electronics es una joven empresa de desarrollo de producto de electrónica, software en la nube e IA con sede en Castellón. En la unidad de negocio de Inteligencia Artificial llevan años desarrollando soluciones de Visión Artificial propias que proporcionen rendimientos altos en situaciones complejas como las relatadas anteriormente (altas velocidades, mala iluminación, diversidad de objetos entre otros.

La solución de Visión Artificial desarrollada por EQUIP Electronics consiste en una solución integral formada por varias aplicaciones utilizando Deep Learning. La primera de ellas es un software de generación de dataset guiado que facilita la creación de un buen dataset con un número bajo de imágenes. Utilizando tecnologías innovadoras como Data Augmentation junto a un potente algoritmo propio se han obtenido resultados de incrementos de hasta el 40-60% de confianza en casos de extrema complejidad.

Una vez generado un buen dataset, a partir de unos metadatos generados por el software de EQUIP Electronics, se aplican parámetros automáticos en el entrenamiento del modelo para sacar un mayor partido en un modelo optimizado para la aplicación de inferencia.

Finalmente la aplicación de inferencia es capaz de, a partir del modelo optimizado para la aplicación ya generado, realizar la detección de los objetos con un framerate adecuado, aplicar distintos tipos de posprocesado, generar reports y clasificado de los assets.


Un caso habitual de aplicación de Visión Artificial son las líneas de producción.

Ponemos a prueba la diferencia en rendimiento haciendo 3 pruebas:

  • CASO 1: Inferencia en una cinta transportadora a diferentes velocidades (m/min) con un modelo generado sin el sistema de generación de dataset guiado con Data Augmentation.
  • CASO 2: La misma prueba pero utilizando el sistema de generación de dataset guiado con Data Augmentation.
  • CASO 3: Lo mismo del experimento anterior pero activando todos los posprocesados adicionales (contorno, comprobación de color, presencia de componentes dentro de los objetos a detectar, etcétera).

Como podemos observar, el dataset optimizado ofrece un rendimiento mucho mayor a velocidades más altas y con variaciones de rendimiento mucho menores. Además, la aplicación de inferencia no reduce rendimiento de forma sustancial al aplicar posprocesados de forma concurrente.

En definitiva, un salto cualitativo en la implementación de sistemas de Visión Artificial aplicable a sectores industriales (con fines de control de calidad o seguridad laboral), smart cities entre otros y que redunda en una mayor productividad y calidad de vida para todos.