Sociedad y Tecnología

Contenidos acerca del cambio socio tecnológico en Chile. Abordamos la adopción de tecnologías y sus consecuencias en el país.

Elaborado por Paulina Benítez M. paulinabenitez14@gmail.com


Primera mirada a los datos públicos

Hoy prestamos atención a los datos creados por el aparato estatal que están alojados en el ciberespacio en calidad de datos abiertos (open data). Ellos conservan los objetivos relacionados con las distintas entidades públicas que los producen. Ilustramos lo anterior haciendo mención al Instituto Nacional de Estadística (INE), cuyo sitio web mantiene vasta información de las estadísticas sociales, económicas y demográficas del país. En cumplimiento de su función técnica la Comisión Nacional de Energía provee periódicamente información de los precios de los combustibles en los servicentros del país en Bencina en línea. Asimismo, las políticas públicas constituyen importantes fuentes de datos. Respecto al sistema de política social nacional una fuente de información es la Encuesta de Caracterización Socioeconómica Nacional (CASEN). Desde 1990 CASEN coloca en el ciberespacio documentos técnicos, tales como, cuestionarios, libros de códigos de la base de datos, bases de datos con resultados y manuales. Otro ejemplo se refiere a los datos de las compras del estado chileno. En el sitio web de Mercado Público está la información de las compras mensuales de las entidades públicas desde 2007.

En entradas anteriores señalamos que la enorme cantidad de datos que existe en el espacio digital se debe al cambio socio tecnológico de gran escala que está soportado en la caída de los costos de transacción en la sociedad y, que motiva a los productores de datos a generarlos y almacenarlos. Nos referimos a personas, empresas y organizaciones públicas. Estas últimas contribuyen con variada información de documentos oficiales, leyes, actas, encuestas y censos, informes institucionales, etc. En general, los datos se han ido duplicando cada tres años siguiendo su propia Ley de Moore (Ford, 2016). Expresión con la que hizo referencia a la característica observada por G. Moore en el microprocesador, el cual a pesar de reducir su tamaño duplicaba la capacidad de datos que se podían introducir en él.

Los datos públicos además del objetivo institucional de administración y transparencia, permiten potencialmente otros usos. Mayer-Shönberger y Cukier (2015) plantearon que una vez que los datos son almacenados en el espacio digital pueden ser usados para otros fines. El Gráfico 1 y Tabla 1 ejemplifican tal cualidad en los datos de Mercado Público. El Gráfico 1 muestra una vista general de todas las órdenes de compra, que permite asociarla con la forma que se encontró entre los creadores de contenido en Facebook (entrada 4) y, la Tabla 1 describe una característica que cumple el conjunto de los valores numéricos de esos datos.

En el Gráfico 1 están las órdenes de compras efectuadas por organismos públicos (servicios de salud, gobierno central, municipalidades, universidades y otros más) a proveedores de todo el país durante abril de 2023. Se ordenaron de mayor a menor valor y, para efectos de una visualización más adecuada sólo se presentan las que se ubican entre las posiciones 1.000 a 120.000. El eje horizontal presenta la ubicación de las órdenes de compra y el vertical, el monto. Por su parte, La Tabla 1 muestra los porcentajes según los dígitos (1 a 9) con que comienzan las órdenes de compra.

Fuente: Elaboración propia, datos de mercado público del 1-24 de abril de 2023

Uno de los primeros investigadores de este tipo de fenómenos en las ciencias sociales fue W. Pareto. En el Siglo XIX, él analizó la propiedad de tierras en Italia, la relación (empírica) que encontró se conoce como la regla de 80-20. La regla de Pareto describe la relación estadística presente en algunos fenómenos sociales en los que una proporción reducida (20%) de eventos contribuye a producir la mayor parte del resultado (80%). En los datos del Gráfico 1 la situación es más extrema, el 10% de las órdenes de compra de mayor monto representan el 83% del gasto total y el 90% restante el 17%. El siguiente ejemplo muestra el amplio rango de valores de las órdenes de compra. El mayor valor de una de éstas asciende a un poco más de 15 mil millones de pesos, en el otro extremo, la orden de compra suma $ 293.000.

Los porcentajes de la Tabla 1 siguen el patrón denominado Ley de Benford o del primer dígito. Lo que permite indicar, en una primera vista, que los datos analizados son un conjunto coherente. En general la ley de Benford se utiliza para hacer auditoría a conjuntos de datos masivos relacionados, principalmente en la verificación de datos financieros.

Podemos concluir que los datos, (i) experimentan transformaciones en el tiempo (nacen, mueren y permanecen) dejando la huella digital (Hilbert, 2013) de la fuente que los genera. Es el caso de los dos patrones (distribución de potencia y ley de Benford) analizados en esta entrada. (ii) Constituyen fuentes de información que tienen un (gran) valor para las ciencias sociales. Como tales pueden ser usados para estudiar variados fenómenos sociales. Los patrones analizados nos permiten tener una mirada indirecta del quehacer de los productores de estos datos. Una ventaja que generaciones anteriores interesadas en la materia no tuvieron. Además, es una de las causas del auge de las profesiones asociadas a la ciencia de datos. (iii) Schwartz (2021) menciona que los cambios experimentados por los datos tocan a las ciencias sociales, al hacerlo desafían ciertos aspectos teóricos, por ejemplo la mantención en el tiempo de la interactividad; que en este caso lo manifiesta la permanencia en el tiempo del registro de las órdenes de compra.



2 respuestas a “Primera mirada a los datos públicos”

  1. […] encuestas (2006, 2009, 2011, 2013, 2015, 2017, 2020, 2022). Tal como especificamos en la entrada Primera mirada a los datos públicos los datos van experimentando transformaciones en el tiempo: nacen, mueren y permanecen dejando una […]

    Me gusta

  2. […] La primera mirada a los datos públicos resumió el valor que poseen los datos abiertos en el análisis del funcionamiento del Estado nacional a través de su huella digital. Los datos abiertos (open data) y el acceso a la información pública (transparencia) tienen fundamentos en la política pública y las leyes. Los organismos públicos aportan a los repositorios digitales información de documentos oficiales, leyes, actas, encuestas y censos, informes institucionales. Este blog sostiene que la posibilidad técnica de acceder a los datos públicos digitales sin dificultades se debe a la caída de los costos de transacción en la sociedad que permite el funcionamiento de la Web 2.0. De modo que cualquier persona u organización motivados por la generación de datos a costos muy bajos de registro, almacenamiento puede agregar contenido en el ciberespacio. […]

    Me gusta

Deja un comentario

About Me

Paulina es doctora en Ciencias Sociales e investigadora independiente. Actualmente, se dedica al estudio del cambio socio tecnológico en Chile basado en el análisis de datos masivos, principalmente públicos. Hasta febrero de 2022 fue profesora de la Universidad de Concepción (Chile).

Newsletter