Discriminación de masas mamográficas mediante K-Nearest Neighbor y atributos BIRADS
DOI:
https://doi.org/10.51252/rcsi.v2i1.225Palabras clave:
cáncer de mama, knn, machine learning, pronósticoResumen
La mamografía es el método más eficaz para la detección del cáncer de mama; sin embargo, el bajo valor predictivo, puede conducir a biopsias innecesarias. Esta investigación tiene como objetivo desarrollar un modelo predictivo para la discriminación de masas mamográficas mediante KNN y el atributo BIRADS con un nivel aceptable de exactitud, precisión, sensibilidad y puntaje-F1. Para ello, realizamos las siguientes fases: limpieza de los datos, entrenamiento del algoritmo KNN y selección del modelo. El resultado obtenido fue un modelo de discriminación de masas mamográficas con una exactitud del 85% así como niveles aceptables de precisión, sensibilidad y puntaje F1. Se concluye que es posible utilizar este modelo como un elemento de juicio para el diagnóstico de cáncer de mama; asimismo, a través de la tasa de error es posible encontrar modelos óptimos en KNN
Citas
Aguilar, R. M., Torres, J. M., & Martín, C. A. (2018). Aprendizaje Automático en la Identificación de Sistemas. Un Caso de Estudio en la Predicción de la Generación Eléctrica de un Parque Eólico. Revista Iberoamericana de Automática e Informática Industrial, 16(1), 114. https://doi.org/10.4995/riai.2018.9421
Al-Azzam, N., & Shatnawi, I. (2021). Comparing supervised and semi-supervised Machine Learning Models on Diagnosing Breast Cancer. Annals of Medicine and Surgery, 53–64. https://doi.org/10.1016/j.amsu.2020.12.043
Alegría Delgado, D., & Huamani Navarro, M. (2019). Factores asociados a la toma de mamografía en mujeres peruanas: análisis de la Encuesta Demográfica de Salud Familiar, 2015. Anales de La Facultad de Medicina, 80(3), 327–331. https://doi.org/10.15381/anales.803.16204
Arslan, H., & Arslan, H. (2021). A new COVID-19 detection method from human genome sequences using CpG island features and KNN classifier. Engineering Science and Technology, an International Journal, 24(4), 839–847. https://doi.org/10.1016/j.jestch.2020.12.026
Blanc Pihuave, G., Cevallos Torres, L., & Arteaga Vera, J. (2020). Modelo computacional de clasificación de aprendizaje de máquina supervisado, para el análisis de datos cardiovasculares y pronóstico médico. Ecuadorian Science Journal, 4(2), 71–79. https://doi.org/10.46480/esj.4.2.83
Pathanjali, C., Vimuktha, E. S., Jalaja, G., & Latha, A. (2018). A Comparative Study of Indian Food Image Classification Using K-Nearest-Neighbour and Support-Vector-Machines. International Journal of Engineering & Technology, 7(3.12), 521. https://doi.org/10.14419/ijet.v7i3.12.16171
Chachaima-Mar, J. E., Pineda-Reyes, J., Marin, R., Lozano-Miranda, Z., & Chian-García, C. (2021). Perfil inmunofenotípico de cáncer de mama de pacientes atendidas en un hospital general de Lima, Perú. Revista Medica Herediana, 31(4), 235–241. https://doi.org/10.20453/rmh.v31i4.3855
Cherif, W. (2018). Optimization of K-NN algorithm by clustering and reliability coefficients: Application to breast-cancer diagnosis. Procedia Computer Science, 127, 293–299. https://doi.org/10.1016/j.procs.2018.01.125
Comarela, G., Franco, G., Trois, C., Liberato, A., Martinello, M., Corrêa, J. H., & Villaça, R. (2019). Introdução à Ciência de Dados: Uma Visão Pragmática utilizando Python, Aplicações e Oportunidades em Redes de Computadores. In Minicursos do XXXVII Simpósio Brasileiro de Redes de Computadores e Sistemas Distribuídos (2019). https://doi.org/10.5753/sbc.6555.9.6
Dhahri, H., Al Maghayreh, E., Mahmood, A., Elkilani, W., & Faisal Nagi, M. (2019). Automated Breast Cancer Diagnosis Based on Machine Learning Algorithms. Journal of Healthcare Engineering, 2019. https://doi.org/10.1155/2019/4253641
Eedi, H., & Kolla, M. (2020). Machine learning approaches for healthcare data analysis. Journal of Critical Reviews, 7(4), 806–811. https://doi.org/10.31838/jcr.07.04.149
Ehsani, R., & Drabløs, F. (2020). Robust Distance Measures for kNN Classification of Cancer Data. Cancer Informatics, 19. https://doi.org/10.1177/1176935120965542
Elter, M. (2007). Mammographic Mass Data Set. UCI Machine Learning Repository. http://archive.ics.uci.edu/ml/datasets/mammographic+mass
Franco, E. F., & Ramos, R. J. (2019). Aprendizaje de Máquina y Aprendizaje Profundo en Biotecnología: Aplicaciones, impactos y desafíos. Ciencia, Ambiente y Clima, 2(2), 7–26. https://doi.org/10.22206/cac.2019.v2i2.pp7-26
García Aranda, M., & Redondo, M. (2019). Immunotherapy: A challenge of breast cancer treatment. Cancers, 11(12), 1–18. https://doi.org/10.3390/cancers11121822
Gardezi, S. J. S., Elazab, A., Lei, B., & Wang, T. (2019). Breast cancer detection and diagnosis using mammographic data: Systematic Review. Journal of Medical Internet Research, 21(7), 1–22. https://doi.org/10.2196/14464
Jean Sunny, Nikita Rane, Rucha Kanade, & Sulochana Devi. (2020). Breast Cancer Classification and Prediction using Machine Learning. International Journal of Engineering Research And, V9(02), 576–580. https://doi.org/10.17577/ijertv9is020280
Mercaldo, F., Nardone, V., & Santone, A. (2017). Diabetes Mellitus Affected Patients Classification and Diagnosis through Machine Learning Techniques. Procedia Computer Science, 112, 2519–2528. https://doi.org/10.1016/j.procs.2017.08.193
Resolución Ministerial N° 442-2017/MINSA[Ministerio de Salud]. Plan Nacional de Prevención y control de cáncer de mama en el Perú 2017-2021. 01 de enero 2017
Mohana Priya, T., & Punithavalli, M. (2019). An efficient data mining techniques - Multi-objective KNN algorithm to predict breast cancer. International Journal of Recent Technology and Engineering, 8(8), 986–990. https://doi.org/10.35940/ijrte.B1188.0882S819
Naufal, S. A., Adiwijaya, A., & Astuti, W. (2020). Analisis Perbandingan Klasifikasi Support Vector Machine (SVM) dan K-Nearest Neighbors (KNN) untuk Deteksi Kanker dengan Data Microarray. JURIKOM (Jurnal Riset Komputer), 7(1), 162. https://doi.org/10.30865/jurikom.v7i1.2014
Rajaguru, H., & Sannasi Chakravarthy, S. R. (2019). Analysis of decision tree and k-nearest neighbor algorithm in the classification of breast cancer. Asian Pacific Journal of Cancer Prevention, 20(12), 3777–3781. https://doi.org/10.31557/APJCP.2019.20.12.3777
Rejón Herrera, E. G., Esparza Sánchez, R., Pasos Ruiz, A., & Moreno Caballero, E. (2021). Clasificación de Indicadores de Interacción del uso de la plataforma Moodle para cursos de modalidad B-learning. Tecnología Educativa Revista CONAIC, 2(1), 78–86. https://doi.org/10.32671/terc.v2i1.170
Thanh Noi, P., & Kappas, M. (2017). Comparison of Random Forest, k-Nearest Neighbor, and Support Vector Machine Classifiers for Land Cover Classification Using Sentinel-2 Imagery. Sensors (Basel, Switzerland), 18(1). https://doi.org/10.3390/s18010018
Uddin, S., Khan, A., Hossain, M. E., & Moni, M. A. (2019). Comparing different supervised machine learning algorithms for disease prediction. BMC Medical Informatics and Decision Making, 19(1), 1–16. https://doi.org/10.1186/s12911-019-1004-8
Vallejos Sologuren, C. S., Aguilar cartagena, A., & Flores Flores, C. J. (2020). Situación del Cáncer en el Perú. Diagnóstico, 52(2), 77–85. https://doi.org/10.33734/diagnostico.v59i2.221
Villavicencio Romero, M. E., Moreno Daza, G. A., Ordóñez Andrade, G. E., & Paredes Colcha, L. M. (2019). Diagnóstico por imágenes de cáncer de mamas. Comparación entre técnica ecográfica y mamografía. Dominio de Las Ciencias, 5(3), 647. https://doi.org/10.23857/dc.v5i3.957
Wu, J., & Hicks, C. (2021). Breast cancer type classification using machine learning. Journal of Personalized Medicine, 11(2), 1–12. https://doi.org/10.3390/jpm11020061
Xing, W., & Bei, Y. (2020). Medical Health Big Data Classification Based on KNN Classification Algorithm. IEEE Access, 8, 28808–28819. https://doi.org/10.1109/ACCESS.2019.2955754
Xu, H., Zhou, J., Asteris, P. G., Armaghani, D. J., & Tahir, M. M. (2019). Supervised machine learning techniques to the prediction of tunnel boring machine penetration rate. Applied Sciences (Switzerland), 9(18), 1–19. https://doi.org/10.3390/app9183715
Zhang, S. (2021). Challenges in KNN Classification. IEEE Transactions on Knowledge and Data Engineering, 1–13. https://doi.org/10.1109/TKDE.2021.3049250
Zielonke, N., Kregting, L. M., Heijnsdijk, E. A. M., Veerus, P., Heinävaara, S., McKee, M., de Kok, I. M. C. M., de Koning, H. J., van Ravesteyn, N. T., Gredinger, G., De Brabander, I., Arbyn, M., Simoens, C., Martens, P., Candeur, M., Arbyn, M., Simoens, C., Burrion, J. B., Dimitrov, P., … Latinovic, R. (2021). The potential of breast cancer screening in Europe. International Journal of Cancer, 148(2), 406–418. https://doi.org/10.1002/ijc.33204
Publicado
Cómo citar
Número
Sección
Licencia
Derechos de autor 2022 Daniel Lévano-Rodriguez, Flor Elizabeth Cerdán-León
Esta obra está bajo una licencia internacional Creative Commons Atribución 4.0.
Los autores retienen sus derechos:
a. Los autores retienen sus derechos de marca y patente, y tambien sobre cualquier proceso o procedimiento descrito en el artículo.
b. Los autores retienen el derecho de compartir, copiar, distribuir, ejecutar y comunicar públicamente el articulo publicado en la Revista Científica de Sistemas e Informática (RCSI) (por ejemplo, colocarlo en un repositorio institucional o publicarlo en un libro), con un reconocimiento de su publicación inicial en la RCSI.
c. Los autores retienen el derecho a hacer una posterior publicación de su trabajo, de utilizar el artículo o cualquier parte de aquel (por ejemplo: una compilación de sus trabajos, notas para conferencias, tesis, o para un libro), siempre que indiquen la fuente de publicación (autores del trabajo, revista, volumen, número y fecha).