Recibido: 02/05/2021
Aceptado:
06/06/2021
Publicado: 19/07/2021
Reconocimiento de
patrones de imágenes a través de un sistema de visión artificial en MATLAB
Recognition of image
patterns through an artificial vision system in MATLAB
1Universidad Nacional de San Martín,
Tarapoto, Perú
jsantamaria@unsm.edu.pe
Resumen. La visión artificial es una
disciplina de la inteligencia artificial que aplica el procesamiento de
imágenes para el reconocimiento de patrones, con el uso algoritmos en ambientes
controlados con una cantidad de iteraciones en el procesamiento de imágenes. La
proliferación de dispositivos de capturas de imágenes ha generado imágenes
digitales en todo el mundo, estas imágenes contienen información que deberían
ser utilizadas por las organizaciones públicas y privadas para la toma de
decisiones. Los objetivos fueron mejorar el reconocimiento de patrones mediante
un sistema de visión artificial, medir el proceso de reconocimiento de
patrones, implementar un sistema de visión artificial y medir la relación que
existe entre reconocimiento de patrones y el un sistema de visión artificial.
Esta fue una investigación aplicada, de tipo cuasi experimental, con corte
transversal, la población y muestra de estudio fueron 8 patrones de imágenes,
la técnica fue la verificación con lista de chequeo, aplicada a 2 grupos, un
grupo control y un grupo experimental. Se concluyó que el tiempo de
procesamiento para el reconocimiento de 8 patrones de imágenes del grupo experimental
fue de 10,75 segundos y de 67,75 segundos para el grupo control y con un grado
de relación entre el reconocimiento de patrones y el sistema de visión
artificial de 72 %.
Palabras clave: Algoritmo,
artificial, digitalización, procesamiento, programación.
Abstract. Artificial
vision is a discipline of artificial intelligence that applies image processing
to pattern recognition, with the use of algorithms in controlled environments
with a number of iterations in image processing. The proliferation of image
capture devices has generated digital images around the world, these images
contain information that should be used by public and private organizations for
decision-making. The objectives were to improve pattern recognition through an
artificial vision system, to measure the pattern recognition process, to
implement an artificial vision system and to measure the relationship between
pattern recognition and an artificial vision system. This was an applied
research, of quasi-experimental type, with cross section, the population and
sample of study were 8 image patterns, the technique was the verification with
checklist, applied to 2 groups, a control group and an experimental group. It
was concluded that the processing time for the recognition of 8 image patterns
of the experimental group was 10.75 seconds and 67.75 seconds for the control
group and with a degree of relationship between pattern recognition and the
artificial vision system of 72%.
Keywords: Algorithm, artificial,
digitalization, processing, programming.
1
Introducción
Un mundo artificial es un modelo computacional usado
para resolver problemas de todo tipo usando técnicas inspiradas en la
naturaleza, como la evolución, la adaptación y la competencia, la inteligencia
artificial es una de las tecnologías emergentes en esta cuarta revolución
industrial, ya que aprovecha la enorme cantidad de información para el
entrenamiento activo y producir máquinas inteligentes que trabajan con modelos
predecibles en tiempo real (Kakani, Nguyen, Kumar, Kim y Pasupuleti, 2020), por
esta razón existen numerosas técnicas para la detección de objetos a través de
la visión artificial (Santos, Dallos y Gaona-García, 2020).
La visión artificial es una disciplina de la
inteligencia artificial, así como el aprendizaje autónomo, aprendizaje
profundo, procesamiento de lenguajes naturales, entre otros (Mujica Rodríguez,
Toribio Salazar, y Cóndor Cámara, 2020). La visión artificial puede aplicarse
en campos de acción como la medicina, agricultura, educación, reconocimiento de
objetos, robótica, redes neuronales (Feng, Jiang, Yang, Du y Li, 2019) la neuro
computación y la neurociencia (Ge y Yu, 2019), pasando por entornos
industriales, académicos y sociales (Acosta et al., 2020), además, constituye
una arquitectura de representación de conocimiento para el aprendizaje visual
en sistemas de visión por computadoras (Souza Alves, De Oliveira, Sanin y
Szczerbicki, 2018).
La visión artificial y el procesamiento de imágenes
contiene un gran número de técnicas y so-luciones, los algoritmos de detección
poseen altos rendimientos de procesamiento, es importante que la delimitación
del problema sea detectada con anticipación para obtener buenos resultados en
ambientes controlados, además se debe poseer una mayor cantidad de iteraciones
en el procesamiento de imágenes para análisis más concretos (Santos et al.,
2020).
La Universidad Nacional de San Martín como institución
de fomenta y realiza investigación científica, posee la línea de investigación
de la inteligencia artificial y recuperación de la información, en la Facultad
de Ingeniería de Sistemas e Informática, la visión artificial es una disciplina
en esta línea.
La proliferación de dispositivos móviles y
dispositivos de capturas de imágenes han generado imágenes digitales en todo el
mundo, en la era de la cuarta revolución industrial, estas imágenes contienen
información que deberían ser utilizadas por las organizaciones públicas y
privadas para la toma de decisiones, el principal inconveniente es el análisis
unitario de cada imagen para obtener información, ya que este proceso toma
demasiado tiempo, otro inconveniente es el poco uso de herramientas
tecnológicas que permitan obtener esta información con un conjunto de imágenes
ya que las mismas solo son utilizadas para el archivo digital correspondiente,
finalmente, el reconocimiento de imágenes con un grupo de características
definidas hace aún más tedioso la toma de datos.
En esta investigación se implementó un sistema que
contiene una cámara que selecciona figuras conocidas, independiente de su
posición y orientación, para luego procesar el fotograma aplicando algoritmos
de extracción de la información contenida en estas (Reyes Ortiz, Mejia y Useche
Castelblanco, 2019).
Los objetivos de la investigación fueron: mejorar el
reconocimiento de patrones mediante un sistema de visión artificial, medir el
proceso de reconocimiento de patrones, implementar un sistema de visión
artificial, medir la relación que existe entre reconocimiento de patrones y el sistema
de visión artificial.
Con esta investigación se logró reconocer objetos de
orientación y posición desconocida, además se implementó un sistema de control
basado en la retroalimentación visual, también utiliza algoritmos para
reconocimiento de imágenes usando cámaras de video, finalmente con el uso de un
sistema de visión artificial se mejoró el reconocimiento de patrones.
2
Materiales y Métodos
Esta
investigación es de tipo aplicada, de diseño cuasi experimental con corte
transversal, donde se utilizó un grupo experimental y un grupo control, el
nivel de la investigación es descriptivo correlacional, la muestra del estudio
fueron de 8 iteraciones para ambos grupos, en el cual se utilizó conocimientos
de algoritmos y técnicas de filtros digitales para procesas imágenes
comparativas de patrones almacenados, logrando describir y correlacionar el
reconocimiento de patrones y el sistema de visión artificial.
La
solución consiste en la obtención de la imagen, pre procesamiento,
segmentación, extracción de características y clasificación con la ayuda de un
soporte para la cámara de video, en los ambientes de la Facultad de Ingeniería
de Sistemas e Informática, una vez que la imagen esté en un ambiente
controlado, se procede a su segmentación y reconocimiento de objetos de forma
independiente. Cada uno de los objetos puede ser comparado por patrones, por lo
que la siguiente tarea es la clasificación o extracción de características para
el reconocimiento (Zhao, Xu, Liu, Tian, y Jiang, 2019).
Para
la realización del experimento, se armó un soporte para la cámara, ente soporte
mantiene la cama fija, también este soporte puede variar la altura de la cámara
(Wan, Toudeshki, Tan, y Ehsani, 2018). También se colocó un fondo negro, donde
las imágenes se ponían por encima del fondo negro (Gila, Bejaoui, Beltrán, y
Jiménez, 2020).
En
el diseño del sistema de visión artificial, la cámara sustituye al ojo humano
(Y. Li, 2020), mientras que el sistema informático se encarga de hacer lo
propio con el cerebro. De esta forma, se reconocen imágenes que previamente han
sido parametrizadas de diversas formas en el sistema (L. Li, Fei, Dong, y Yang,
2020). este debe ser capaz de verificar la presencia o ausencia de objetos,
medir sus dimensiones físicas y reconocerlos (Liu et al., 2020).
Se
diseñó el algoritmo de visión artificial teniendo los diagramas por cada paso o
hito del programa que tienen ver con procesos de tratamiento de imágenes para
el fotograma de las muestras (Sivkov et al., 2020), en el sistema de visión
artificial se ejecuta la detección de los parámetros de la cámara, luego se
inicia la cámara de video y se muestra en una interfaz gráfica. Después se
sigue la secuencia que se muestra en el diagrama de secuencia de la distinción
de regiones en los fotogramas del video.
Tenemos
que tener en cuenta que la subrutina de eliminación de regiones pequeñas e
identificación por patrones (ver Fig. 1), está dentro del diagrama de secuencia
de la distinción de regiones en los fotogramas del video (ver Fig. 2).
Figura
1. Diagrama
de secuencia de la distinción de regiones en los fotogramas del video
Figura 2. Subrutina de eliminación de
regiones pequeñas e identificación por patrones
Podemos
observar la sub rutina diagrama de secuencia de incrustación de región y
creación de una nueva (ver Fig. 4), se encuentra dentro de reconocer en patrón
(ver Fig. 3).
Figura 3. Subrutina de reconocer en patrón.
Figura 4. Diagrama de secuencia de
incrustación de región y creación de una nueva.
Para
el experimento se utilizó una computadora portátil con el procesador Intel Core
i7-4700MQ 2.4GHz, memoria RAM 12 GB DDR3 Ampliable a 16GB, tarjeta de video
NVIDIA® GeForce® GT 740M 2GB DDR3, cámara web integrada y cámara web Microsoft
LifeCam Studio USB 1920 x 1080 - Q2F-00013. Los requisitos de software mínimo
con los que realizamos el experimento son: sistema operativo Windows 8.1 en
español, software MATLAB para codificar el sistema de visión artificial para el
reconocimiento de patrones, los patrones para el experimento fueron 8
personajes de la película de Toy Story como son: Woody, Buzz Lightyear, Betty,
Duke, Benson, Bunny, Gabby y Tin.
3
Resultados y discusiones
3.1
Implementación de un sistema de visión artificial
Al
implementar el sistema de visión artificial y ponerlo en funcionamiento se
obtuvieron valores del tiempo de medición y valores de cantidad de figuras o
regiones en cada muestra, donde cada figura o región es comparada con un grupo
de patrones establecidos. Estos son comparados con el fotograma de las muestras
tomadas del video y luego es procesada para pasar a proceso de reconocimiento.
Para implementar el sistema de visión artificial se utilizó el MATLAB. Para el
experimento se determinó 8 patrones, donde el sistema reconocerá procesando un
fotograma captado de la cámara de video. Los patrones que se muestras son los
personajes de la película de Toy Story y son Woody, Buzz Lightyear, Betty,
Duke, Benson, Bunny, Gabby y Tin. Al tomar las muestras usando el software de
visión artificial se obtuvieron las siguientes muestras se pue-de observar que
el promedio de conteo para las diferentes muestras de personajes
correspondiente al grupo experimental es de 10,75 segundos, reflejadas en (Tabla
1).
|
3.2
Registro de la información
Se realizó el experimento tomándose
las muestras del grupo control, conformada por personas que reconocen y cuentan
diferentes imágenes de personajes, estas personas están entre las edades de 5 a
13 años de edad y el grupo experimental conformado por el software de visión
artificial que permitió realizar los conteos de diferentes imágenes, las
personas realizaron el reconocimiento y conteo manual guiándose de las
imágenes, las misma que las del sistema de visión artificial, en el cual medimos
el tiempo de respuesta del problema planteado. Se observó que el promedio de
conteo de diferentes imágenes de personajes correspondiente al grupo control es
de 67,75 segundos. Estos datos obtenidos se corroboran en la Tabla 1.
|
El levantamiento de información,
análisis y medición de los indicadores ha permitido reconocer patrones mediante
un sistema de visión artificial y tabulando la Tabla 1 del grupo experimental y
del grupo control. Para ello se obtuvo los datos de 8 muestras, tanto del grupo
control y del grupo experimental. Para poder hacer la prueba de hipótesis, se
tomó un nivel de significancia de 0,5. En la Tabla 2 se aplicó la prueba t
Student, para diseños experimentales de 2 grupos, con 14 grados de libertad y a
una cota tenemos valor crítico de t es -1,761310136. Se observa que el estadístico
de T es menor que el “t” en la Tabla T-Student 7,162562377, y está fuera de la
zona de aceptación de la hipótesis nula, menor al valor crítico de t (una cola)
de -1,761310136, por lo tanto, se rechaza la hipótesis nula y se acepta la
hipótesis alternativa.
Figura 5. Relación entre reconocimiento de patrones y el sistema de
visión artificial.
Usando los datos de la Tabla 1,
encontramos la correlación de Pearson encontramos la relación de y = 0.6826x -
1.6228, donde “y” es reconocimiento de patrones y “x” es el sistema de visión
artificial. También se encontró el grado de relación entre el reconocimiento de
patrones y el sistema de visión artificial que es de 72 % (ver Fig. 1)
3.3
Discusión de resultados.
Los resultados evidencian que el
sistema de visión artificial tuvo una respuesta más rápida en comparación con
el grupo control, esto afirma lo que plantean Syberfeldt y Vuoluterä (2020),
donde los sistemas de visión artificial poseen mayor precisión que la
identificación de imágenes y sus patrones a través del ojo humano, de esta
manera, se colocó una cámara web Microsoft LifeCam Studio USB 1920 x 1080 -
Q2F-00013, el mismo que sustituyó al ojo humano y el sistema informático que
representó al sistema de visión artificial desarrollado, Además, la detección y
clasificación de imágenes en segmentos, los resultados muestran que la
implementación del algoritmo en MATLAB hace más precisión este proceso en
relación a la identificación de patrones en ambientes controlados (Khan y
Al-Habsi, 2020).
Otro de los aspectos de la rapidez
del sistema de visión artificial frente al grupo control es el hardware estable
y compacto que se ha implementado para este sistema el cual permite recoger
datos de la segmentación de las imágenes, en tiempo real, independiente de su
orientación y posición, esto confirma los datos presentados por Pérez, Cavanzo
Nisso y Villavisán Buitrago (2018). Para el caso de la toma de datos para el
reconocimiento de patrones, se ha tomado en cuenta cualquier posición de las
imágenes para este proceso, además el algoritmo ha permitido desarrollar una
herramienta de soporte para agilizar el proceso de segmentación, afirmando las
conclusiones de Marino-Vera, Mendoza y Gualdrón-Guerrero (2017), y las
conclusiones de Azueto-Ríos, Santiago-Godoy, Hernández-Gómez y
Hernández-Santiago (2017), al afirmar que la segmentación correcta se logra con
los algoritmos de clasificación con criterios de separabilidad para el
reconocimiento de patrones.
El algoritmo implementado para el
reconocimiento de patrones se refiere al proceso mediante el cual reconocemos
eventos recurrentes (Delgado, 2017); en efecto cuando el sistema de visión
artificial diseñado en esta investigación ejecuta subrutina de eliminación de
regiones pequeñas e identificación por patrones, estos están en un lazo
recurrente tal como se expresa en el diagrama de secuencia de la Figura 3.
En óptica se llama reflexión especular a aquella reflexión
que se produce cuando la superficie de un material es perfectamente lisa y
plana (microscópicamente hablando), haciendo que los rayos (o haces) de luz
incidentes y reflejados tengan el mismo ángulo respecto de la normal de la
superficie de reflexión (Kuznetsov, Gorevoy y Machikhin, 2019), esta conclusión
es acorde para esta investigación ya que en las superficies lisas se refleja la
luz aun siendo superficies negras, esto hace que al capturar el fotograma y
procesar la imagen digital binaria, las superficies aparezcan de color blanco.
4
Conclusiones
La implementación del sistema de
visión artificial, se aplicó el análisis de tiempo de procesamiento de las
imágenes divididas en regiones, obteniendo un promedio de tiempo de
procesamiento para el reconocimiento de 8 patrones de imágenes de 10,75
segundos y un promedio de número de regiones en el fotograma de la muestra 18,125.
Se midió el tiempo de reconocimiento
de imágenes grupo control (conformada por personas reconocen y cuentan
diferentes imágenes de personajes, estas personas están entre las edades de 5 a
13 años de edad) y del grupo experimental (sistema de visión artificial);
arrojando un promedio de 10,75 segundos para el grupo experimental y de 67,75
segundos para el grupo control.
Se puede aseverar estadísticamente después de la prueba de
hipótesis que “con el uso de un sistema de visión artificial, se mejorará el
reconocimiento de patrones”, teniendo un grado de relación entre el
reconocimiento de patrones y el sistema de visión artificial es de 72 %.
Referencias bibliográficas
Acosta, A., Aguilar, V., Carreño, R., Patiño, M., Patiño, J., &
Martinez, M. A. (2020). Nuevas tecnologías como factor de cambio ante los retos
de la inteligencia artificial y la sociedad del conocimiento. Espacios, 41(5), 25. https://www.revistaespacios.com/a20v41n05/a20v41n05p25.pdf
Azueto-Ríos, Santiago-Godoy, R., Hernández-Gómez, L. E., &
Hernández-Santiago, K. A. (2017). Implementación de un sistema de imagenología
infrarroja para la detección vascular del antebrazo y mano. Revista Mexicana de Ingenieria Biomedica,
38(2), 479–491. https://doi.org/10.17488/RMIB.38.2.4
Delgado León, D. (2017). Diseño de un sistema de adquisición de imágenes
basado en cámaras web USB y hardware reconfigurable. Revista de Ingeniería Electrónica, Automática y Comunicaciones,
38(2) 1–11. https://rielac.cujae.edu.cu/index.php/rieac/article/view/404
Feng, X., Jiang, Y., Yang, X., Du, M., & Li, X.
(2019). Computer vision algorithms and hardware implementations: A survey. In
Integration (Vol. 69, pp. 309–320). Elsevier
B.V. https://doi.org/10.1016/j.vlsi.2019.07.005
Ge, H., & Yu, H. (2019). The application and design
of neural computation in visual perception. Journal
of Visual Communication and Image Representation, 59, 309–315. https://doi.org/10.1016/j.jvcir.2019.01.020
Gila, A., Bejaoui, M. A., Beltrán, G., & Jiménez, A. (2020). Rapid method based on computer vision to determine the
moisture and insoluble impurities content in virgin olive oils. Food Control, 113, 107210. https://doi.org/10.1016/j.foodcont.2020.107210
Kakani, V., Nguyen, V. H., Kumar, B. P., Kim, H., &
Pasupuleti, V. R. (2020). A critical review on computer vision and artificial
intelligence in food industry. Journal of
Agriculture and Food Research, 2, 100033. https://doi.org/10.1016/j.jafr.2020.100033
Khan, A. I., & Al-Habsi, S. (2020). Machine Learning in Computer Vision. Procedia Computer Science, 167, 1444–1451. https://doi.org/10.1016/j.procs.2020.03.355
Kuznetsov, A. O., Gorevoy, A. V., & Machikhin, A.
S. (2019). Image rectification for prism-based stereoscopic optical systems. Computer Vision and Image Understanding,
182, 30–37. https://doi.org/10.1016/j.cviu.2019.02.003
Li, L., Fei, X., Dong, Z., & Yang, T. (2020).
Computer vision-based method for monitoring grain quantity change in
warehouses. Grain & Oil Science and
Technology, 3(3), 87–99. https://doi.org/10.1016/j.gaost.2020.06.001
Li, Y. (2020). A calibration method of computer vision
system based on dual attention mechanism. Image
and Vision Computing, 103, 104039. https://doi.org/10.1016/j.imavis.2020.104039
Liu, D., Oczak, M., Maschat, K., Baumgartner, J.,
Pletzer, B., He, D., & Norton, T. (2020). A computer vision-based method
for spatial-temporal action recognition of tail-biting behaviour in
group-housed pigs. Biosystems Engineering, 195, 27–41. https://doi.org/10.1016/j.biosystemseng.2020.04.007
Marino-Vera, H., Mendoza, L. E., & Gualdrón-Guerrero, O. E. (2017).
Medición automática de variables antropométricas para la evaluación de la respiración
usando visión artificial. Revista de Investigación,
Desarrollo e Innovación, 8(1), 161. https://doi.org/10.19053/20278306.v8.n1.2017.7407
Mujica Rodríguez, I. E., Toribio Salazar, L. M., & Cóndor Cámara, D.
F. (2020). Inteligencia artificial como apoyo a intervenciones no
farmacológicas para combatir la COVID-19. Revista
Peruana de Medicina Experimental y Salud Pública, 37(3), 582–584. https://doi.org/10.17843/rpmesp.2020.373.5704
Pérez, M., Cavanzo Nisso, G. A., & Villavisán Buitrago, F. (2018).
Sistema embebido de detección de movimiento mediante visión artificial. Visión Electrónica, 12(1), 97–101. https://doi.org/10.14483/22484728.15087
Reyes Ortiz, O. J., Mejia, M., & Useche Castelblanco, J. S. (2019).
Técnicas de inteligencia artificial utilizadas en el procesamiento de imágenes
y su aplicación en el análisis de pavimentos. Revista EIA, 16(31), 189–207. https://doi.org/10.24050/reia.v16i31.1215
Santos, D., Dallos, L., & Gaona-García, P. A. (2020). Motion tracking algorithms using AI and machine
learning techniques. Informacion Tecnologica, 31(3), 23–38. https://doi.org/10.4067/S0718-07642020000300023
Sivkov, S., Novikov, L., Romanova, G., Romanova, A., Vaganov, D., Valitov,
M., & Vasiliev, S. (2020). The algorithm
development for operation of a computer vision system via the OpenCV library. Procedia Computer
Science, 169, 662–667. https://doi.org/10.1016/j.procs.2020.02.193
Souza Alves, T. De, De Oliveira, C. S., Sanin, C., & Szczerbicki, E.
(2018). From Knowledge based
Vision Systems to Cognitive Vision Systems: A Review. Procedia Computer Science, 126, 1855–1864. https://doi.org/10.1016/j.procS.2018.08.077
Syberfeldt, A., & Vuoluterä, F. (2020). Image
processing based on deep neural networks for detecting quality problems in
paper bag production. Procedia CIRP, 93,
1224–1229. https://doi.org/10.1016/j.procir.2020.04.158
Wan, P., Toudeshki, A., Tan, H., & Ehsani, R. (2018). A methodology for fresh tomato maturity detection using
computer vision. Computers and
Electronics in Agriculture, 146, 43–50. https://doi.org/10.1016/j.compag.2018.01.011
Zhao, Z. Q., Xu, S. T., Liu, D., Tian, W. D., & Jiang, Z. Da. (2019). A review of image set classification. Neurocomputing, 335, 251–260. https://doi.org/10.1016/j.neucom.2018.09.090
Conflicto de intereses
La
presente publicación no presenta conflicto de intereses.
Contribuciones de los autores
Santa
María Pinedo, John Clark, investigador y redactor del presente artículo; García
Estrella, Cristian Werner, investigador y redactor del presente artículo; Ríos
López, Carlos Armando, investigador, redactor y facilitador del presente
artículo y Rodríguez Grández, Carlos, investigador, redactor y facilitador del
presente artículo.