Identificación de escritores árabes para niños utilizando atención adversarial optimizada y clasificación híbrida dinámica
DOI:
https://doi.org/10.51252/rcsi.v4i2.642Palabras clave:
aprendizaje automático, autoencoders variacionales, BPOA, DenseNet, ResNetResumen
El reconocimiento de escritura árabe es un dominio esencial en la investigación de visión por computadora. Sin embargo, su complejidad, la naturaleza intrincada, las variadas técnicas de escritura y el vocabulario superpuesto de los textos han resultado en una escasez de estudios publicados en este ámbito. Este artículo propone un modelo que aborda la identificación de escritores árabes para niños, en el cual se utiliza un modelo de Autoencoder Variacional con Atención Adversarial para la extracción de características y el Algoritmo de Optimización de Pelícano Binario para la reducción de características. Además, el artículo sugiere un nuevo modelo de clasificación mediante un Clasificador Híbrido de Enrutamiento Dinámico (ResNet + DenseNet). Para analizar el rendimiento del modelo propuesto, se utilizaron los conjuntos de datos QUWI y Khat. Los resultados demuestran que, para ambos conjuntos de datos, se alcanza una alta precisión del 98,8%, el resultado más alto entre todos los trabajos relevantes que describimos en el artículo. Esto sugiere que el sistema logra una alta precisión y ofrece una forma novedosa de mejorar la identificación de escritores mediante el uso de algoritmos de optimización y técnicas avanzadas de aprendizaje automático.
Citas
Aabed, S., & Khairaldin, A. (2024). An End-to-End, Segmentation-Free, Arabic Handwritten Recognition Model on KHATT. arXiv (Cornell University). https://doi.org/10.48550/arxiv.2406.15329
Ahmad, R., Naz, S., Afzal, M., Rashid, S., Liwicki, M., & Dengel, A. (2020). A Deep Learning based Arabic Script Recognition System: Benchmark on KHAT. The International Arab Journal of Information Technology, 17(3), 299–305. https://doi.org/10.34028/iajit/17/3/3 DOI: https://doi.org/10.34028/iajit/17/3/3
Altwaijry, N., & Al-Turaiki, I. (2020). Arabic handwriting recognition system using convolutional neural network. Neural Computing and Applications, 33(7), 2249–2261. https://doi.org/10.1007/s00521-020-05070-8 DOI: https://doi.org/10.1007/s00521-020-05070-8
Alrobah, N., & Albahli, S. (2021). A Hybrid Deep Model for Recognizing Arabic Handwritten Characters. IEEE Access, 9, 87058–87069. https://doi.org/10.1109/access.2021.3087647 DOI: https://doi.org/10.1109/ACCESS.2021.3087647
Bennour, A., Boudraa, M., Siddiqi, I., Al-Sarem, M., Al-Shabi, M., & Ghabban, F. (2024). A deep learning framework for historical manuscripts writer identification using data-driven features. Multimedia Tools and Applications. https://doi.org/10.1007/s11042-024-18187-y DOI: https://doi.org/10.1007/s11042-024-18187-y
Diaz, M., Ferrer, M. A., Impedovo, D., Malik, M. I., Pirlo, G., & Plamondon, R. (2019). A perspective analysis of handwritten signature technology. ACM Computing Surveys, 51(6), 1–39. https://doi.org/10.1145/3274658 DOI: https://doi.org/10.1145/3274658
Libo, H., & Jingqi, X. (2024). Increasing the Accuracy of Writer Identification Based on Bee Colony Optimization Algorithm and Hybrid Deep Learning Method. International Journal of Advanced Computer Science and Applications, 15(6). https://doi.org/10.14569/ijacsa.2024.0150631 DOI: https://doi.org/10.14569/IJACSA.2024.0150631
Maaz, S., & Issa, H. (2020). Using Deep Learning for Arabic Writer Identification. International Journal of Computer Applications, 175(25), 1–7. https://doi.org/10.5120/ijca2020920783 DOI: https://doi.org/10.5120/ijca2020920783
Morera, Á., Sánchez, Á., Vélez, J. F., & Moreno, A. B. (2018). Gender and Handedness Prediction from Offline Handwriting Using Convolutional Neural Networks. Complexity, 2018(1). https://doi.org/10.1155/2018/3891624 DOI: https://doi.org/10.1155/2018/3891624
Mustafa, M. E., & Khalafallah, M. (2020). A Deep Learning Approach for Handwritten Arabic Names Recognition. International Journal of Advanced Computer Science and Applications, 11(1). https://doi.org/10.14569/ijacsa.2020.0110183 DOI: https://doi.org/10.14569/IJACSA.2020.0110183
Pawan M., Ritu G., Naveen, Arica N., Priyanka D., Vinay S., Amandeep K. & Kajal S. (2024). Handwriting Detection System Using Brain Net and AI Algorithm. Tuijin Jishu, 45 (1), 2235-2244. https://www.propulsiontechjournal.com/index.php/journal/article/view/4488
Rabaev, I., Alkoran, I., Wattad, O., & Litvak, M. (2022). Automatic Gender and Age Classification from Offline Handwriting with Bilinear ResNet. Sensors, 22(24), 9650. https://doi.org/10.3390/s22249650 DOI: https://doi.org/10.3390/s22249650
Rehman, A., Naz, S., Razzak, M. I., & Hameed, I. A. (2019). Automatic Visual Features for Writer Identification: A Deep Learning Approach. IEEE Access, 7, 17149–17157. https://doi.org/10.1109/access.2018.2890810 DOI: https://doi.org/10.1109/ACCESS.2018.2890810
Trivedi, P., Heimann, M., Koutra, D., & Thiagarajan, J. J. (2021). Interrogating Paradigms in Self-supervised Graph Representation Learning. In Lawrence Livermore National Lab. (LLNL), Livermore, CA (United States). https://www.osti.gov/biblio/1863175
Trojovský, P., & Dehghani, M. (2022). Pelican Optimization Algorithm: A Novel Nature-Inspired Algorithm for Engineering Applications. Sensors, 22(3), 855. https://doi.org/10.3390/s22030855 DOI: https://doi.org/10.3390/s22030855
Ullah, Z., & Jamjoom, M. (2022). An intelligent approach for Arabic handwritten letter recognition using convolutional neural network. PeerJ Computer Science, 8, e995. https://doi.org/10.7717/peerj-cs.995 DOI: https://doi.org/10.7717/peerj-cs.995
Younis, M. T., Younus, Y. T., Hasoon, J. N., Fadhil, A. H., & Mostafa, S. A. (2022). An accurate Alzheimer’s disease detection using a developed convolutional neural network model. Bulletin of Electrical Engineering and Informatics, 11(4), 2005–2012. https://doi.org/10.11591/eei.v11i4.3659 DOI: https://doi.org/10.11591/eei.v11i4.3659
Zhang, J., Yu, X., Lei, X., & Wu, C. (2022). A novel CapsNet neural network based on MobileNetV2 structure for robot image classification. Frontiers in Neurorobotics, 16. https://doi.org/10.3389/fnbot.2022.1007939 DOI: https://doi.org/10.3389/fnbot.2022.1007939
Descargas
Publicado
Cómo citar
Número
Sección
Licencia
Derechos de autor 2024 Worood Najem, Tahrir Muhanad
Esta obra está bajo una licencia internacional Creative Commons Atribución 4.0.
Los autores retienen sus derechos:
a. Los autores retienen sus derechos de marca y patente, y tambien sobre cualquier proceso o procedimiento descrito en el artículo.
b. Los autores retienen el derecho de compartir, copiar, distribuir, ejecutar y comunicar públicamente el articulo publicado en la Revista Científica de Sistemas e Informática (RCSI) (por ejemplo, colocarlo en un repositorio institucional o publicarlo en un libro), con un reconocimiento de su publicación inicial en la RCSI.
c. Los autores retienen el derecho a hacer una posterior publicación de su trabajo, de utilizar el artículo o cualquier parte de aquel (por ejemplo: una compilación de sus trabajos, notas para conferencias, tesis, o para un libro), siempre que indiquen la fuente de publicación (autores del trabajo, revista, volumen, número y fecha).