Citar como: Santa-Maria, J., Ríos, C., Rodríguez, C. & García, C. (2021). Reconocimiento de patrones de imágenes a través de un sistema de visión artificial en MATLAB. Revista Científica De Sistemas E Informática1(2), 15-26. https://doi.org/10.51252/rcsi.v1i2.131

Recibido: 02/05/2021

Aceptado: 06/06/2021

Publicado: 19/07/2021


Reconocimiento de patrones de imágenes a través de un sistema de visión artificial en MATLAB

Recognition of image patterns through an artificial vision system in MATLAB

Santa-Maria, John1[0000-0002-8594-4865]; Ríos, Carlos 1[0000-0002-1349-6119]; Rodríguez, Carlos1[0000-0001-5925-8506] y García, Cristian1[0000-0002-5687-8694]

1Universidad Nacional de San Martín, Tarapoto, Perú

jsantamaria@unsm.edu.pe

Resumen. La visión artificial es una disciplina de la inteligencia artificial que aplica el procesamiento de imágenes para el reconocimiento de patrones, con el uso algoritmos en ambientes controlados con una cantidad de iteraciones en el procesamiento de imágenes. La proliferación de dispositivos de capturas de imágenes ha generado imágenes digitales en todo el mundo, estas imágenes contienen información que deberían ser utilizadas por las organizaciones públicas y privadas para la toma de decisiones. Los objetivos fueron mejorar el reconocimiento de patrones mediante un sistema de visión artificial, medir el proceso de reconocimiento de patrones, implementar un sistema de visión artificial y medir la relación que existe entre reconocimiento de patrones y el un sistema de visión artificial. Esta fue una investigación aplicada, de tipo cuasi experimental, con corte transversal, la población y muestra de estudio fueron 8 patrones de imágenes, la técnica fue la verificación con lista de chequeo, aplicada a 2 grupos, un grupo control y un grupo experimental. Se concluyó que el tiempo de procesamiento para el reconocimiento de 8 patrones de imágenes del grupo experimental fue de 10,75 segundos y de 67,75 segundos para el grupo control y con un grado de relación entre el reconocimiento de patrones y el sistema de visión artificial de 72 %.

Palabras clave: Algoritmo, artificial, digitalización, procesamiento, programación.

Abstract. Artificial vision is a discipline of artificial intelligence that applies image processing to pattern recognition, with the use of algorithms in controlled environments with a number of iterations in image processing. The proliferation of image capture devices has generated digital images around the world, these images contain information that should be used by public and private organizations for decision-making. The objectives were to improve pattern recognition through an artificial vision system, to measure the pattern recognition process, to implement an artificial vision system and to measure the relationship between pattern recognition and an artificial vision system. This was an applied research, of quasi-experimental type, with cross section, the population and sample of study were 8 image patterns, the technique was the verification with checklist, applied to 2 groups, a control group and an experimental group. It was concluded that the processing time for the recognition of 8 image patterns of the experimental group was 10.75 seconds and 67.75 seconds for the control group and with a degree of relationship between pattern recognition and the artificial vision system of 72%.

Keywords: Algorithm, artificial, digitalization, processing, programming.


1            Introducción

Un mundo artificial es un modelo computacional usado para resolver problemas de todo tipo usando técnicas inspiradas en la naturaleza, como la evolución, la adaptación y la competencia, la inteligencia artificial es una de las tecnologías emergentes en esta cuarta revolución industrial, ya que aprovecha la enorme cantidad de información para el entrenamiento activo y producir máquinas inteligentes que trabajan con modelos predecibles en tiempo real (Kakani, Nguyen, Kumar, Kim y Pasupuleti, 2020), por esta razón existen numerosas técnicas para la detección de objetos a través de la visión artificial (Santos, Dallos y Gaona-García, 2020).

La visión artificial es una disciplina de la inteligencia artificial, así como el aprendizaje autónomo, aprendizaje profundo, procesamiento de lenguajes naturales, entre otros (Mujica Rodríguez, Toribio Salazar, y Cóndor Cámara, 2020). La visión artificial puede aplicarse en campos de acción como la medicina, agricultura, educación, reconocimiento de objetos, robótica, redes neuronales (Feng, Jiang, Yang, Du y Li, 2019) la neuro computación y la neurociencia (Ge y Yu, 2019), pasando por entornos industriales, académicos y sociales (Acosta et al., 2020), además, constituye una arquitectura de representación de conocimiento para el aprendizaje visual en sistemas de visión por computadoras (Souza Alves, De Oliveira, Sanin y Szczerbicki, 2018).

La visión artificial y el procesamiento de imágenes contiene un gran número de técnicas y so-luciones, los algoritmos de detección poseen altos rendimientos de procesamiento, es importante que la delimitación del problema sea detectada con anticipación para obtener buenos resultados en ambientes controlados, además se debe poseer una mayor cantidad de iteraciones en el procesamiento de imágenes para análisis más concretos (Santos et al., 2020).

La Universidad Nacional de San Martín como institución de fomenta y realiza investigación científica, posee la línea de investigación de la inteligencia artificial y recuperación de la información, en la Facultad de Ingeniería de Sistemas e Informática, la visión artificial es una disciplina en esta línea.

La proliferación de dispositivos móviles y dispositivos de capturas de imágenes han generado imágenes digitales en todo el mundo, en la era de la cuarta revolución industrial, estas imágenes contienen información que deberían ser utilizadas por las organizaciones públicas y privadas para la toma de decisiones, el principal inconveniente es el análisis unitario de cada imagen para obtener información, ya que este proceso toma demasiado tiempo, otro inconveniente es el poco uso de herramientas tecnológicas que permitan obtener esta información con un conjunto de imágenes ya que las mismas solo son utilizadas para el archivo digital correspondiente, finalmente, el reconocimiento de imágenes con un grupo de características definidas hace aún más tedioso la toma de datos.

En esta investigación se implementó un sistema que contiene una cámara que selecciona figuras conocidas, independiente de su posición y orientación, para luego procesar el fotograma aplicando algoritmos de extracción de la información contenida en estas (Reyes Ortiz, Mejia y Useche Castelblanco, 2019).

Los objetivos de la investigación fueron: mejorar el reconocimiento de patrones mediante un sistema de visión artificial, medir el proceso de reconocimiento de patrones, implementar un sistema de visión artificial, medir la relación que existe entre reconocimiento de patrones y el sistema de visión artificial.

Con esta investigación se logró reconocer objetos de orientación y posición desconocida, además se implementó un sistema de control basado en la retroalimentación visual, también utiliza algoritmos para reconocimiento de imágenes usando cámaras de video, finalmente con el uso de un sistema de visión artificial se mejoró el reconocimiento de patrones.

2            Materiales y Métodos

Esta investigación es de tipo aplicada, de diseño cuasi experimental con corte transversal, donde se utilizó un grupo experimental y un grupo control, el nivel de la investigación es descriptivo correlacional, la muestra del estudio fueron de 8 iteraciones para ambos grupos, en el cual se utilizó conocimientos de algoritmos y técnicas de filtros digitales para procesas imágenes comparativas de patrones almacenados, logrando describir y correlacionar el reconocimiento de patrones y el sistema de visión artificial.

La solución consiste en la obtención de la imagen, pre procesamiento, segmentación, extracción de características y clasificación con la ayuda de un soporte para la cámara de video, en los ambientes de la Facultad de Ingeniería de Sistemas e Informática, una vez que la imagen esté en un ambiente controlado, se procede a su segmentación y reconocimiento de objetos de forma independiente. Cada uno de los objetos puede ser comparado por patrones, por lo que la siguiente tarea es la clasificación o extracción de características para el reconocimiento (Zhao, Xu, Liu, Tian, y Jiang, 2019).

Para la realización del experimento, se armó un soporte para la cámara, ente soporte mantiene la cama fija, también este soporte puede variar la altura de la cámara (Wan, Toudeshki, Tan, y Ehsani, 2018). También se colocó un fondo negro, donde las imágenes se ponían por encima del fondo negro (Gila, Bejaoui, Beltrán, y Jiménez, 2020).

En el diseño del sistema de visión artificial, la cámara sustituye al ojo humano (Y. Li, 2020), mientras que el sistema informático se encarga de hacer lo propio con el cerebro. De esta forma, se reconocen imágenes que previamente han sido parametrizadas de diversas formas en el sistema (L. Li, Fei, Dong, y Yang, 2020). este debe ser capaz de verificar la presencia o ausencia de objetos, medir sus dimensiones físicas y reconocerlos (Liu et al., 2020).

Se diseñó el algoritmo de visión artificial teniendo los diagramas por cada paso o hito del programa que tienen ver con procesos de tratamiento de imágenes para el fotograma de las muestras (Sivkov et al., 2020), en el sistema de visión artificial se ejecuta la detección de los parámetros de la cámara, luego se inicia la cámara de video y se muestra en una interfaz gráfica. Después se sigue la secuencia que se muestra en el diagrama de secuencia de la distinción de regiones en los fotogramas del video.

Tenemos que tener en cuenta que la subrutina de eliminación de regiones pequeñas e identificación por patrones (ver Fig. 1), está dentro del diagrama de secuencia de la distinción de regiones en los fotogramas del video (ver Fig. 2).

Figura 1. Diagrama de secuencia de la distinción de regiones en los fotogramas del video

 

Figura 2. Subrutina de eliminación de regiones pequeñas e identificación por patrones

Podemos observar la sub rutina diagrama de secuencia de incrustación de región y creación de una nueva (ver Fig. 4), se encuentra dentro de reconocer en patrón (ver Fig. 3).

Figura 3. Subrutina de reconocer en patrón.

Figura 4. Diagrama de secuencia de incrustación de región y creación de una nueva.

Para el experimento se utilizó una computadora portátil con el procesador Intel Core i7-4700MQ 2.4GHz, memoria RAM 12 GB DDR3 Ampliable a 16GB, tarjeta de video NVIDIA® GeForce® GT 740M 2GB DDR3, cámara web integrada y cámara web Microsoft LifeCam Studio USB 1920 x 1080 - Q2F-00013. Los requisitos de software mínimo con los que realizamos el experimento son: sistema operativo Windows 8.1 en español, software MATLAB para codificar el sistema de visión artificial para el reconocimiento de patrones, los patrones para el experimento fueron 8 personajes de la película de Toy Story como son: Woody, Buzz Lightyear, Betty, Duke, Benson, Bunny, Gabby y Tin.

3            Resultados y discusiones

3.1        Implementación de un sistema de visión artificial

Al implementar el sistema de visión artificial y ponerlo en funcionamiento se obtuvieron valores del tiempo de medición y valores de cantidad de figuras o regiones en cada muestra, donde cada figura o región es comparada con un grupo de patrones establecidos. Estos son comparados con el fotograma de las muestras tomadas del video y luego es procesada para pasar a proceso de reconocimiento. Para implementar el sistema de visión artificial se utilizó el MATLAB. Para el experimento se determinó 8 patrones, donde el sistema reconocerá procesando un fotograma captado de la cámara de video. Los patrones que se muestras son los personajes de la película de Toy Story y son Woody, Buzz Lightyear, Betty, Duke, Benson, Bunny, Gabby y Tin. Al tomar las muestras usando el software de visión artificial se obtuvieron las siguientes muestras se pue-de observar que el promedio de conteo para las diferentes muestras de personajes correspondiente al grupo experimental es de 10,75 segundos, reflejadas en (Tabla 1).

Tabla 1.
Tiempo de reconocimiento y conteo del grupo experimental y el grupo control.

Muestra

Número de regiones en el fotograma

Tiempo de procesamiento

(segundos)

 

 

Grupo Experimental

Grupo Control

1

15

9

15

2

19

11

19

3

18

11

18

4

17

9

17

5

18

12

18

6

18

10

18

7

21

13

21

8

19

11

19

Promedio

10,75

67,75

3.2        Registro de la información

Se realizó el experimento tomándose las muestras del grupo control, conformada por personas que reconocen y cuentan diferentes imágenes de personajes, estas personas están entre las edades de 5 a 13 años de edad y el grupo experimental conformado por el software de visión artificial que permitió realizar los conteos de diferentes imágenes, las personas realizaron el reconocimiento y conteo manual guiándose de las imágenes, las misma que las del sistema de visión artificial, en el cual medimos el tiempo de respuesta del problema planteado. Se observó que el promedio de conteo de diferentes imágenes de personajes correspondiente al grupo control es de 67,75 segundos. Estos datos obtenidos se corroboran en la Tabla 1.

Tabla 2.
Prueba t Student para el grupo control y del grupo experimental

Prueba t para dos muestras suponiendo varianzas iguales

Reconocimiento de patrones

Sistema de vision artificial

 

Media

10.75

67.75

Varianza

1,928571429

513.6428571

Observaciones

8

8

Varianza agrupada

257,7857143

 

Diferencia hipotética de las medias

0.5

 

Grados de libertad

14

 

Estadístico t

-7,162562377

 

P(T<=t) una cola

2.41958E-06

 

Valor crítico de t (una cola)

1,761310136

 

 

El levantamiento de información, análisis y medición de los indicadores ha permitido reconocer patrones mediante un sistema de visión artificial y tabulando la Tabla 1 del grupo experimental y del grupo control. Para ello se obtuvo los datos de 8 muestras, tanto del grupo control y del grupo experimental. Para poder hacer la prueba de hipótesis, se tomó un nivel de significancia de 0,5. En la Tabla 2 se aplicó la prueba t Student, para diseños experimentales de 2 grupos, con 14 grados de libertad y a una cota tenemos valor crítico de t es -1,761310136. Se observa que el estadístico de T es menor que el “t” en la Tabla T-Student 7,162562377, y está fuera de la zona de aceptación de la hipótesis nula, menor al valor crítico de t (una cola) de -1,761310136, por lo tanto, se rechaza la hipótesis nula y se acepta la hipótesis alternativa.

Figura 5. Relación entre reconocimiento de patrones y el sistema de visión artificial.

Usando los datos de la Tabla 1, encontramos la correlación de Pearson encontramos la relación de y = 0.6826x - 1.6228, donde “y” es reconocimiento de patrones y “x” es el sistema de visión artificial. También se encontró el grado de relación entre el reconocimiento de patrones y el sistema de visión artificial que es de 72 % (ver Fig. 1)

3.3        Discusión de resultados.

Los resultados evidencian que el sistema de visión artificial tuvo una respuesta más rápida en comparación con el grupo control, esto afirma lo que plantean Syberfeldt y Vuoluterä (2020), donde los sistemas de visión artificial poseen mayor precisión que la identificación de imágenes y sus patrones a través del ojo humano, de esta manera, se colocó una cámara web Microsoft LifeCam Studio USB 1920 x 1080 - Q2F-00013, el mismo que sustituyó al ojo humano y el sistema informático que representó al sistema de visión artificial desarrollado, Además, la detección y clasificación de imágenes en segmentos, los resultados muestran que la implementación del algoritmo en MATLAB hace más precisión este proceso en relación a la identificación de patrones en ambientes controlados (Khan y Al-Habsi, 2020).

Otro de los aspectos de la rapidez del sistema de visión artificial frente al grupo control es el hardware estable y compacto que se ha implementado para este sistema el cual permite recoger datos de la segmentación de las imágenes, en tiempo real, independiente de su orientación y posición, esto confirma los datos presentados por Pérez, Cavanzo Nisso y Villavisán Buitrago (2018). Para el caso de la toma de datos para el reconocimiento de patrones, se ha tomado en cuenta cualquier posición de las imágenes para este proceso, además el algoritmo ha permitido desarrollar una herramienta de soporte para agilizar el proceso de segmentación, afirmando las conclusiones de Marino-Vera, Mendoza y Gualdrón-Guerrero (2017), y las conclusiones de Azueto-Ríos, Santiago-Godoy, Hernández-Gómez y Hernández-Santiago (2017), al afirmar que la segmentación correcta se logra con los algoritmos de clasificación con criterios de separabilidad para el reconocimiento de patrones.

El algoritmo implementado para el reconocimiento de patrones se refiere al proceso mediante el cual reconocemos eventos recurrentes (Delgado, 2017); en efecto cuando el sistema de visión artificial diseñado en esta investigación ejecuta subrutina de eliminación de regiones pequeñas e identificación por patrones, estos están en un lazo recurrente tal como se expresa en el diagrama de secuencia de la Figura 3.

En óptica se llama reflexión especular a aquella reflexión que se produce cuando la superficie de un material es perfectamente lisa y plana (microscópicamente hablando), haciendo que los rayos (o haces) de luz incidentes y reflejados tengan el mismo ángulo respecto de la normal de la superficie de reflexión (Kuznetsov, Gorevoy y Machikhin, 2019), esta conclusión es acorde para esta investigación ya que en las superficies lisas se refleja la luz aun siendo superficies negras, esto hace que al capturar el fotograma y procesar la imagen digital binaria, las superficies aparezcan de color blanco.

4            Conclusiones

La implementación del sistema de visión artificial, se aplicó el análisis de tiempo de procesamiento de las imágenes divididas en regiones, obteniendo un promedio de tiempo de procesamiento para el reconocimiento de 8 patrones de imágenes de 10,75 segundos y un promedio de número de regiones en el fotograma de la muestra 18,125.

Se midió el tiempo de reconocimiento de imágenes grupo control (conformada por personas reconocen y cuentan diferentes imágenes de personajes, estas personas están entre las edades de 5 a 13 años de edad) y del grupo experimental (sistema de visión artificial); arrojando un promedio de 10,75 segundos para el grupo experimental y de 67,75 segundos para el grupo control.

Se puede aseverar estadísticamente después de la prueba de hipótesis que “con el uso de un sistema de visión artificial, se mejorará el reconocimiento de patrones”, teniendo un grado de relación entre el reconocimiento de patrones y el sistema de visión artificial es de 72 %.

Referencias bibliográficas

Acosta, A., Aguilar, V., Carreño, R., Patiño, M., Patiño, J., & Martinez, M. A. (2020). Nuevas tecnologías como factor de cambio ante los retos de la inteligencia artificial y la sociedad del conocimiento. Espacios, 41(5), 25.  https://www.revistaespacios.com/a20v41n05/a20v41n05p25.pdf

Azueto-Ríos, Santiago-Godoy, R., Hernández-Gómez, L. E., & Hernández-Santiago, K. A. (2017). Implementación de un sistema de imagenología infrarroja para la detección vascular del antebrazo y mano. Revista Mexicana de Ingenieria Biomedica, 38(2), 479–491. https://doi.org/10.17488/RMIB.38.2.4

Delgado León, D. (2017). Diseño de un sistema de adquisición de imágenes basado en cámaras web USB y hardware reconfigurable. Revista de Ingeniería Electrónica, Automática y Comunicaciones, 38(2) 1–11. https://rielac.cujae.edu.cu/index.php/rieac/article/view/404

Feng, X., Jiang, Y., Yang, X., Du, M., & Li, X. (2019). Computer vision algorithms and hardware implementations: A survey. In Integration (Vol. 69, pp. 309–320). Elsevier B.V. https://doi.org/10.1016/j.vlsi.2019.07.005

Ge, H., & Yu, H. (2019). The application and design of neural computation in visual perception. Journal of Visual Communication and Image Representation, 59, 309–315. https://doi.org/10.1016/j.jvcir.2019.01.020

Gila, A., Bejaoui, M. A., Beltrán, G., & Jiménez, A. (2020). Rapid method based on computer vision to determine the moisture and insoluble impurities content in virgin olive oils. Food Control, 113, 107210. https://doi.org/10.1016/j.foodcont.2020.107210

Kakani, V., Nguyen, V. H., Kumar, B. P., Kim, H., & Pasupuleti, V. R. (2020). A critical review on computer vision and artificial intelligence in food industry. Journal of Agriculture and Food Research, 2, 100033. https://doi.org/10.1016/j.jafr.2020.100033

Khan, A. I., & Al-Habsi, S. (2020). Machine Learning in Computer Vision. Procedia Computer Science, 167, 1444–1451. https://doi.org/10.1016/j.procs.2020.03.355

Kuznetsov, A. O., Gorevoy, A. V., & Machikhin, A. S. (2019). Image rectification for prism-based stereoscopic optical systems. Computer Vision and Image Understanding, 182, 30–37. https://doi.org/10.1016/j.cviu.2019.02.003

Li, L., Fei, X., Dong, Z., & Yang, T. (2020). Computer vision-based method for monitoring grain quantity change in warehouses. Grain & Oil Science and Technology, 3(3), 87–99. https://doi.org/10.1016/j.gaost.2020.06.001

Li, Y. (2020). A calibration method of computer vision system based on dual attention mechanism. Image and Vision Computing, 103, 104039. https://doi.org/10.1016/j.imavis.2020.104039

Liu, D., Oczak, M., Maschat, K., Baumgartner, J., Pletzer, B., He, D., & Norton, T. (2020). A computer vision-based method for spatial-temporal action recognition of tail-biting behaviour in group-housed pigs. Biosystems Engineering, 195, 27–41. https://doi.org/10.1016/j.biosystemseng.2020.04.007

Marino-Vera, H., Mendoza, L. E., & Gualdrón-Guerrero, O. E. (2017). Medición automática de variables antropométricas para la evaluación de la respiración usando visión artificial. Revista de Investigación, Desarrollo e Innovación, 8(1), 161. https://doi.org/10.19053/20278306.v8.n1.2017.7407

Mujica Rodríguez, I. E., Toribio Salazar, L. M., & Cóndor Cámara, D. F. (2020). Inteligencia artificial como apoyo a intervenciones no farmacológicas para combatir la COVID-19. Revista Peruana de Medicina Experimental y Salud Pública, 37(3), 582–584. https://doi.org/10.17843/rpmesp.2020.373.5704

Pérez, M., Cavanzo Nisso, G. A., & Villavisán Buitrago, F. (2018). Sistema embebido de detección de movimiento mediante visión artificial. Visión Electrónica, 12(1), 97–101. https://doi.org/10.14483/22484728.15087

Reyes Ortiz, O. J., Mejia, M., & Useche Castelblanco, J. S. (2019). Técnicas de inteligencia artificial utilizadas en el procesamiento de imágenes y su aplicación en el análisis de pavimentos. Revista EIA, 16(31), 189–207. https://doi.org/10.24050/reia.v16i31.1215

Santos, D., Dallos, L., & Gaona-García, P. A. (2020). Motion tracking algorithms using AI and machine learning techniques. Informacion Tecnologica, 31(3), 23–38. https://doi.org/10.4067/S0718-07642020000300023

Sivkov, S., Novikov, L., Romanova, G., Romanova, A., Vaganov, D., Valitov, M., & Vasiliev, S. (2020). The algorithm development for operation of a computer vision system via the OpenCV library. Procedia Computer Science, 169, 662–667. https://doi.org/10.1016/j.procs.2020.02.193

Souza Alves, T. De, De Oliveira, C. S., Sanin, C., & Szczerbicki, E. (2018). From Knowledge based Vision Systems to Cognitive Vision Systems: A Review. Procedia Computer Science, 126, 1855–1864. https://doi.org/10.1016/j.procS.2018.08.077

Syberfeldt, A., & Vuoluterä, F. (2020). Image processing based on deep neural networks for detecting quality problems in paper bag production. Procedia CIRP, 93, 1224–1229. https://doi.org/10.1016/j.procir.2020.04.158

Wan, P., Toudeshki, A., Tan, H., & Ehsani, R. (2018). A methodology for fresh tomato maturity detection using computer vision. Computers and Electronics in Agriculture, 146, 43–50. https://doi.org/10.1016/j.compag.2018.01.011

Zhao, Z. Q., Xu, S. T., Liu, D., Tian, W. D., & Jiang, Z. Da. (2019). A review of image set classification. Neurocomputing, 335, 251–260. https://doi.org/10.1016/j.neucom.2018.09.090

Conflicto de intereses

La presente publicación no presenta conflicto de intereses.

Contribuciones de los autores

Santa María Pinedo, John Clark, investigador y redactor del presente artículo; García Estrella, Cristian Werner, investigador y redactor del presente artículo; Ríos López, Carlos Armando, investigador, redactor y facilitador del presente artículo y Rodríguez Grández, Carlos, investigador, redactor y facilitador del presente artículo.