convergence
Análisis semántico latente para la detección de noticias falsas sobre COVID-19 utilizando computación heterogénea
PDF

Palabras clave

análisis semántico latente
computación heterogénea
Covid-19
procesamiento de lenguaje natural

Cómo citar

Vega, B. ., León, G. ., & Morales, D. (2021). Análisis semántico latente para la detección de noticias falsas sobre COVID-19 utilizando computación heterogénea. Convergence Tech, 5(V), 19–29. https://doi.org/10.53592/convtech.v5iV.14

Resumen

La detección de noticias falsas hoy en día es un gran reto para los sistemas de predicción debido a la gran cantidad de información que se tiene actualmente, en especial, en fuentes de información como las redes sociales, blogs o sitios de web. En adición, la capacidad de procesamiento que se requiere para analizar grandes cantidades de datos es muy grande por lo que el tiempo de ejecución tiende a ser alto. En este artículo se propone un sistema de aprendizaje utilizando paradigmas de procesamiento en paralelo a nivel de CPU y GPU usando el dataset COVID-19 Open Research Dataset Challenge (CORD-19) para un primer enfoque a la detección de noticias falsas sobre COVID-19. El sistema de predicción está basado en técnicas de procesamiento de lenguaje natural utilizando como modelo de entrenamiento el análisis semántico latente o LSA, por sus siglas en ingles. También, se utilizan técnicas de multiprocesamiento a nivel de CPU para el preprocesamiento de texto, obtención de términos o palabras claves, obtención de matriz termino por documento, normalización de valores utilizando TF-IDF y obtención de la similitud de coseno, mientras que para la parte de reducción de la dimensionalidad utilizando la descomposición de valores singulares o SVD, por sus siglas en ingles se ha utilizado la arquitectura de CUDA para el procesamiento a nivel de la GPU.

https://doi.org/10.53592/convtech.v5iV.14
PDF

Descargas

Los datos de descargas todavía no están disponibles.