Sociedad y Tecnología

Contenidos acerca del cambio socio tecnológico en Chile. Abordamos la adopción de tecnologías y sus consecuencias en el país.

Elaborado por Paulina Benítez M. paulinabenitez14@gmail.com


Primera mirada a los datos públicos

Hoy prestamos atención a los datos creados por el aparato estatal que están alojados en el ciberespacio en calidad de datos abiertos (open data). Estos conservan los objetivos relacionados con las distintas entidades públicas que los producen. Ilustramos lo anterior haciendo mención al Instituto Nacional de Estadística (INE) cuyo sitio web mantiene vasta información de las estadísticas sociales, económicas y demográficas del país. Por otra parte, en cumplimiento de su función técnica, la Comisión Nacional de Energía provee periódicamente información de los precios de los combustibles que venden los servicentros del país en Bencina en línea. También las políticas públicas constituyen importantes fuentes de datos. Respecto al sistema de política social nacional una fuente de información es la Encuesta de Caracterización Socioeconómica Nacional (CASEN), desde 1990 CASEN coloca documentos técnicos en el ciberespacio, tales como, cuestionarios, libros de códigos, bases de datos, manuales y resultados. Otro ejemplo se refiere a los datos de las compras del estado chileno. En el sitio web de Mercado Público está la información de las compras mensuales de las entidades públicas desde 2007.

En entradas anteriores señalamos que la enorme cantidad de datos que existe en el espacio digital se debe al cambio socio tecnológico de gran escala que está soportado en la caída de los costos de transacción en la sociedad, lo que motiva a los productores de datos a generarlos y almacenarlos, nos referimos a personas, empresas y organizaciones públicas. Estas últimas contribuyen con variada información de documentos oficiales, leyes, actas, encuestas, censos, informes institucionales, etc. Los datos en general se han ido duplicando cada tres años siguiendo su propia Ley de Moore (Ford, 2016), una expresión que hace referencia a la característica observada por G. Moore en el microprocesador, el cual a pesar de reducir su tamaño duplicaba la capacidad de datos que se podían introducir en él.

Los datos públicos además del objetivo institucional de administración y transparencia permiten potencialmente otros usos; Mayer-Shönberger y Cukier (2015) plantearon que una vez que los datos son almacenados en el espacio digital pueden ser usados para otros fines. El Gráfico 1 y Tabla 1 ejemplifican esta cualidad para los datos de Mercado Público. El Gráfico 1 muestra la vista general de todas las órdenes de compra del período comprendido entre el 1-24 de abril de 2023, la que permite asociarla con la forma que se encontró entre los creadores de contenido en Facebook (entrada 4). La Tabla 1 describe una característica que cumple el conjunto de los valores numéricos de esos datos.

En el Gráfico 1 están las órdenes de compras (en adelante OCO efectuadas por los organismos públicos (servicios de salud, gobierno central, municipalidades, universidades y otros más) a los proveedores de todo el país durante abril de 2023. Las OC fueron ordenadas de mayor a menor valor, y para efectos de una visualización adecuada sólo se presentan las que se ubican entre las posiciones 1.000 a 120.000. El eje horizontal presenta la ubicación de las órdenes de compra y el eje vertical el monto. La Tabla 1 muestra los porcentajes según los dígitos de 1 al 9 con que comienza el valor de las órdenes de compra.

Fuente: Elaboración propia, datos de mercado público del 1-24 de abril de 2023

Uno de los primeros investigadores de este tipo de fenómenos en las ciencias sociales fue W. Pareto que en el Siglo XIX analizó la propiedad de tierras en Italia, la relación empírica que encontró se conoce como la regla de 80-20. La regla de Pareto describe la relación estadística presente en algunos fenómenos sociales en los que una proporción reducida de eventos, el 20%, contribuye a producir la mayor parte del resultado, el 80%. En los datos del Gráfico 1 la situación es más extrema, porque el 10% de las OC de mayor monto representan el 83% del gasto total y el 90% restante el 17%. El siguiente ejemplo muestra el amplio rango de valores de las órdenes de compra, el mayor valor de una de ellas asciende a un poco más de 15 mil millones de pesos, y en el otro extremo, una orden de compra suma $ 293.000.

Los porcentajes de la Tabla 1 siguen el patrón denominado Ley de Benford o del primer dígito. Lo que en una primera vista permite indicar que los datos analizados son un conjunto coherente. En general la ley de Benford se utiliza para hacer auditoría a conjuntos de datos masivos relacionados principalmente, con la verificación de datos financieros.

Podemos concluir que los datos, (i) experimentan transformaciones en el tiempo (nacen, mueren y permanecen) dejando una huella digital (Hilbert, 2013) de la fuente que los genera. Es el caso de los dos patrones analizados en esta entrada (distribución de potencia y ley de Benford). (ii) Constituyen fuentes de información que tienen gran valor para las ciencias sociales, puesto que pueden ser usados para estudiar variados fenómenos sociales. Los patrones analizados permiten tener una mirada indirecta del quehacer de los productores de los datos. Una ventaja que las generaciones anteriores interesadas en la materia no tuvieron. Además, es una de las causas del auge de las profesiones asociadas a la ciencia de datos. Finalmente, (iii) Schwartz (2021) menciona que los cambios experimentados por los datos almacenados en el ciberespacio tocan a las ciencias sociales porque desafían ciertos aspectos teóricos, por ejemplo, la mantención en el tiempo de la interactividad. En el caso de los datos de Mercado Público se manifiesta en la permanencia del registro de las órdenes de compra.



2 respuestas a «Primera mirada a los datos públicos»

  1. […] encuestas (2006, 2009, 2011, 2013, 2015, 2017, 2020, 2022). Tal como especificamos en la entrada Primera mirada a los datos públicos los datos van experimentando transformaciones en el tiempo: nacen, mueren y permanecen dejando una […]

    Me gusta

  2. […] La primera mirada a los datos públicos resumió el valor que poseen los datos abiertos en el análisis del funcionamiento del Estado nacional a través de su huella digital. Los datos abiertos (open data) y el acceso a la información pública (transparencia) tienen fundamentos en la política pública y las leyes. Los organismos públicos aportan a los repositorios digitales información de documentos oficiales, leyes, actas, encuestas y censos, informes institucionales. Este blog sostiene que la posibilidad técnica de acceder a los datos públicos digitales sin dificultades se debe a la caída de los costos de transacción en la sociedad que permite el funcionamiento de la Web 2.0. De modo que cualquier persona u organización motivados por la generación de datos a costos muy bajos de registro, almacenamiento puede agregar contenido en el ciberespacio. […]

    Me gusta

Deja un comentario

About Me

Paulina es doctora en Ciencias Sociales e investigadora independiente. Actualmente, se dedica al estudio del cambio socio tecnológico en Chile basado en el análisis de datos masivos, principalmente públicos. Hasta febrero de 2022 fue profesora de la Universidad de Concepción (Chile).

Newsletter