Seguir y comparar los ecosistemas informativos iberoamericanos

Hoy, gracias a los avances de la ciencia de datos en la web, se pueden seguir y analizar con cierta facilidad los contenidos informativos y las interacciones de los usuarios con los medios de comunicación de masas.

En base a los esfuerzos realizados por el Fondecyt 1150545 se desarrolló una estructura de crawler que resultó bastante eficiente y estable para seguir y extraer datos abiertos de más de 500 cuentas de medios de comunicación chilenos en Twitter.

Recientemente hemos replicado el esfuerzo para explorar las cuentas de 1146 de iberoamerica.

En la siguiente imagen se puede ver como para la búsqueda: pandemia + epidemia + covid + coronavirus + pandemic + epidemic + virus + viruses + sars. Se encotraron 98.991 menciones en 110 medios mexicanos en 90 días.

En la imagen que sigue se obsersa la salida de datos textuales que ofrece el sistema que se puede copiar y pegar para organizar hojas de cálculo o documentos que puedan constituirse en corpus para nuevos análisis o realizar etiquedatos que categoricen las noticias.

El crawler permite además realizar visualizaciones de datos (histogramas, tortas y gráficos lineales) y gestionar dashboard para hacer tracking de tendencias. Un ejemplo simple de las posibilidadades analíticas las podemos encontrar en el caso Cuatro alcaldes y una pandemia

Si te interesa conocer el funcionamiento, explorar sus posibilidades y colaborar con el mejoramiento de la herramienta puedes contactar a lcarcamo@uach.cl . Organizaremos webinars para interesados y colaboradores.

 

Facebooktwittergoogle_plusredditpinterestlinkedinmail
Este artículo fue escrito en Sin categoría. Enlace Permanente.

Agregar un comentario

Su dirección de correo no se hará público. Los campos requeridos están marcados *