Sociedad y Tecnología

Contenidos acerca del cambio socio tecnológico en Chile. Abordamos la adopción de tecnologías y sus consecuencias en el país.

Elaborado por Paulina Benítez M. paulinabenitez14@gmail.com


La mirada indirecta. Actualización de los datos de noticias del Gobierno Regional de Biobío

Entre los principales conceptos que trabaja este blog está la huella digital (Hilbert, 2013), a la que definimos como el rastro que dejan los datos que quedan alojados en el ciberespacio. Ese rastro es uno de los objetivos de estudio de la ciencia de datos también conocido como búsqueda de patrones en los datos. Aquel rastro o patrón en los datos se entiende como dar una mirada indirecta al quehacer de la entidad que los produce, una organización, o una persona. La clave del proceso es que los datos publicados permanecen en el ciberespacio y que, por lo tanto, se pueden recuperar y analizar en cualquier momento.

Esta entrada analiza la huella digital que deja el Gobierno Regional (GORE) del Biobío a través de las noticias publicadas en su página web. El trabajo de revisión de las noticias entre 2019-2025 representa la actualización de los datos analizados en una entrada anterior sobre la huella digital del GORE Biobío de 2019-2024 publicada en septiembre de 2024. El conjunto de noticias del período 2019-2025 lo forman 1.499 noticias, y hay un par de cuestiones del período que considerar. Primero, el lapso desde marzo de 2020 hasta la mitad del 2021 corresponde a la alerta sanitaria por pandemia de COVID-19. En segundo lugar, están las modificaciones en la administración de las regiones chilenas introducidas por la ley 21.073. Entre las que destacan el cambio de la máxima autoridad del Intendente regional, nombrado por el Presidente de la República, al Gobernador Regional elegido por sufragio universal en votación directa. Y la creación del cargo de Delegado Presidencial Regional, el representante del Presidente de la República en la región. En consecuencia, la entrada en vigencia de la ley marca dos subperíodos: uno desde enero de 2019 al 13 de julio de 2021, el otro desde el 14 de julio de 2021 en adelante.

El Cuadro 1 presenta el resumen del trabajo. El Gráfico 1 muestra la cantidad de noticias por semana del período mencionado, el gráfico incluye dos rectas segmentadas para indicar el límite superior y el inferior. El límite superior consiste en la media más el valor de una desviación estándar y el límite inferior es la media menos el valor de una desviación estándar. El Gráfico 2 muestra la distribución de las noticias semanales, que están concentradas en torno a la media de cuatro noticias por semana, en el período hay sesenta semanas con cuatro noticias. El Gráfico 3 muestra la distribución de palabras por noticia, que también aparecen agrupadas en torno a una media, que es de 552 palabras. En resumen, el Cuadro 1 indica que el GORE Biobío publica cuatro noticias semanales, su desviación estándar es 2,8 noticias y su contenido promedio es 552 palabras.

En el primer elemento de análisis, la cantidad de noticias semanales publicadas por el GORE Biobío, en la mayoría de las semanas se aprecia que la cantidad de noticias está en el rango comprendido entre los dos límites definidos. Además, al ver su distribución (Gráfico 2) se observa que ella se asemeja a una distribución normal (el 68% de los datos está entre el promedio y más o menos una desviación estándar, y el 95% de los datos está entre el promedio y más o menos dos desviaciones estándar). Por lo tanto, se puede asumir que el promedio es una característica representativa de los datos en todo el período analizado, a pesar que en el último año los datos están en el nivel inferior del rango y de la aparición de algunos valores atípicos (“outliers”). El primer punto puede deberse a la instalación del nuevo gobierno regional, y los valores atípicos surgen por motivos, tales como, la estacionalidad de algunas actividades, el inicio y termino del año administrativo, los feriados, etc. Lo que se puede corroborar si se analizan los valores vecinos de un valor atípico, por ejemplo, el número máximo de noticias del período fue dieciséis en la semana del 14 de enero de 2024, aun cuando las noticias de las dos semanas anteriores y las dos semanas siguientes a la fecha se encuentran dentro del rango “normal”, con una secuencia de 1, 8, 16, 8, 3 respectivamente. Lo mismo ocurrió cuando hubo pocas o ninguna noticia durante una semana. Un dato adicional que robustece el promedio de noticias es que la cantidad es similar al de los gobiernos regionales vecinos, el GORE de la Araucanía tiene un promedio de 3,5 y el de Ñuble 5,4.

Se puede postular que la cantidad de noticias semanales es una métrica estable en el tiempo, es decir, es un patrón (huella digital). ¿Qué indica este patrón acerca de la organización que lo genera? Las cuatro noticias semanales del período indican indirectamente la capacidad de la organización o son la muestra de la importancia que la organización otorga a las actividades que realiza. En otras palabras, las cuatro noticias semanales indican la capacidad que tiene el GORE Biobío de ejecutar actividades o son las actividades que el GORE Biobío determina que son las más importantes de su quehacer.

Ahondar en las preguntas implica avanzar en el estudio de los textos que componen el corpus de noticias a través del análisis de texto en forma de clasificación, agrupamiento de noticias, extracción de entidades nombradas, análisis de sentimiento y otros. Aspectos que buscan entregar información del contenido las noticias. Una primera forma de analizar los textos después de separarlos en palabras, es buscar las palabras que aparecen juntas en las noticias. Existen muchos pares de palabras que no entregan información pues son palabras compuestas que indican nombres de personas o lugares, por ejemplo, comuna de Santa Juana. Sin embargo, hay otros que entregan significado al texto, en las noticias del GORE Biobío encontramos el siguiente conjunto de pares de palabras o bigram: (‘medio’, ‘ambiente’), (‘adultos’, ‘mayores’),  (‘obras’, ‘públicas’), (‘calidad’, ‘vida’), (‘transporte’, ‘público’),(‘desarrollo’, ‘regional’), (‘inversión’, ‘millones’), (‘mil’, ‘millones’), (‘millones’, ‘pesos’), (‘mejorar’, ‘calidad’), (‘servicio’, ‘salud’), (‘desarrollo’, ‘social’), (‘universidad’, ‘concepción’), (‘mil’, ‘personas’), (‘incendios’, ‘forestales’). Ellos muestran un conjunto de tópicos preliminares que se entienden como el quehacer del gobierno regional. Se puede postular que su análisis temporal (ciclo de vida de ese par de palabras en los textos) y su priorización (cantidad de veces que se menciona el bigram en el texto) permite discernir si corresponde a un límite en la capacidad de la organización o si indican sus prioridades. La recurrencia del bigram y de su contenido en las noticias -no cambian las palabras que acompañan al bigram- podrían mostrar aspectos donde la organización tiene dificultades en la resolución de un problema.

Un ejemplo de un bigram recurrente en las noticias del GORE Biobío es el de «incendios, forestales», que prácticamente muestra que todos los años hubo noticias que los aluden, Las noticias más importantes (ya que repiten el bigram a los menos tres veces en el texto) aparecieron en el 2019 (febrero); 2021 (enero); 2023 (abril y agosto); 2025 (enero y septiembre). Su contenido también es recurrente y presenta información sobre las medidas adoptadas para enfrentarlos (construcción de cortafuegos, coordinaciones institucionales regionales, creación de registros específicos) y las reuniones de autoridades regionales y nacionales.



Deja un comentario

About Me

Paulina es doctora en Ciencias Sociales e investigadora independiente. Actualmente, se dedica al estudio del cambio socio tecnológico en Chile basado en el análisis de datos masivos, principalmente públicos. Hasta febrero de 2022 fue profesora de la Universidad de Concepción (Chile).

Newsletter