Holgado-Apaza, L, A. et al
2 Rev. Cient. Sist. Inform. 3(2): e587; (Jul-Dic, 2023). e-ISSN: 2709-992X
1. INTRODUCCIÓN
Comprender el sentimiento de la población con respecto a la COVID-19 es de suma importancia para las
autoridades, ya que les permite evaluar cómo sus acciones impactan en las emociones de los ciudadanos.
La pandemia de la COVID-19 que tuvo lugar en el año 2020, junto con las medidas de cuarentena
implementadas por los líderes de distintos países, resultó en un incremento significativo de la actividad en
las redes sociales, como Twitter (IPSOS, 2020).
Durante este período, las personas se vieron obligadas a aislarse, lo cual generó una mayor participación
en dichas plataformas, incluyendo la publicación de opiniones y noticias con una carga emocional
considerable (Mendoza Castillo, 1970). Por consiguiente, los tweets generados durante el año 2020 se
convirtieron en una valiosa fuente de datos para analizar el comportamiento y el sentimiento público con
relación a la pandemia.
En la mayoría de los estudios relacionados con el análisis de sentimientos, se han utilizado tres etiquetas
para la clasificación de emociones: positivo, neutro y negativo (Yang et al., 2020). Sin embargo, durante la
pandemia, el análisis de los sentimientos de las personas se vuelve mucho más complejo que simplemente
toca categorizarlos en estas tres dimensiones.
En un texto, se pueden expresar una amplia gama de emociones, por lo que se requieren etiquetas más
detalladas para comprender de manera más precisa los sentimientos y emociones de las personas durante
la crisis de COVID-19 (Alturayeif & Luqman, 2021).
A la fecha, se han llevado a cabo diversos estudios que abordan el análisis de esta información. Por ejemplo,
Topbas et al. (2021) proponen modelos de aprendizaje profundo para el análisis de sentimientos en tweets
relacionados con COVID-19. Emplean técnicas como redes neuronales recurrentes (RNN) y el modelo de
representaciones de codificador bidireccional (BERT) para clasificar los tweets en las tres categorías de
positivo, neutro y negativo.
Por otro lado, Sitaula et al. (2021) proponen el uso de tres métodos de extracción de características
diferentes, a saber, basado en texto rápido (ft), específico de dominio (ds) y agnóstico de dominio (da), para
representar los tweets. Luego, utilizan redes neuronales convolucionales (CNN) para clasificar los tweets
en las tres clases de positivo, neutral y negativo.
En un estudio realizado por Blanco & Lourenço (2022), se propone la clasificación del sentimiento en
optimista y pesimista. Utilizan algoritmos de aprendizaje automático comunes, como Support Vector
Machines, Random Forest y Naïve Bayes, en combinación con la técnica TF-IDF, y logran obtener buenos
resultados.
Además, Imvimol & Chongstitvatana, 2021 consideran la clasificación de emociones en seis categorías: ira,
disgusto, miedo, tristeza, alegría y sorpresa. Para ello, emplean diversas técnicas, como el perceptrón
multicapa, RNN, LSTM, LSTM bidireccional y GRU.
En el estudio presentado por Alturayeif & Luqman (2021), se propone un modelo multietiqueta para
clasificar 11 emociones en tweets de idioma árabe. Utilizan transformadores bidireccionales
específicamente entrenados con el conjunto de datos SenWave (Yang et al., 2020). Además, los autores
consideran la clasificación de emojis, previa conversión a su equivalente en texto.
Los estudios anteriores proporcionan una visión de los enfoques y técnicas empleados para el análisis de
sentimientos y emociones en tweets relacionados con el COVID-19. Sin embargo, hay una falta de
investigación específica enfocada en el contexto de Lima, Perú. Por lo tanto, en este estudio, nos
proponemos abordar esta brecha y analizar las emociones presentes en los tweets sobre COVID-19 en la
ciudad de Lima durante el año 2020.