Sociedad y Tecnología

Contenidos acerca del cambio socio tecnológico en Chile. Abordamos la adopción de tecnologías y sus consecuencias en el país.

Elaborado por Paulina Benítez M. paulinabenitez14@gmail.com


Consideraciones para añadir valor a los datos abiertos

Uno de los temas que aborda este blog tiene relación con los datos abiertos publicados en Chile. Si bien ellos responden a los objetivos institucionales de administración y transparencia (soportados por leyes y regulaciones: Ley 20.285, 2008 del acceso a la información pública. Ley 21.180, 2019; Ley 21.464, 2022 sobre materias de transformación digital del Estado) también pueden ser reutilizados en otras actividades que generan valor a la sociedad, por ejemplo, reconstruir alguno de los índices publicados periódicamente por las instituciones del gobierno nacional. Además, la dinámica (ciclo de vida) que van experimentando los datos permite advertir al menos otras dos cuestiones importantes: que en su devenir queda la huella digital (Hilbert, 2013) de la organización/institución que los generó y que, con el tiempo van presentando ciertos inconvenientes que afectan su uso cuando se necesita combinarlos con otros datos para ampliar los ámbitos de análisis.

La calidad de los datos generalmente se caracteriza por la exactitud, integridad, coherencia, confiabilidad, accesibilidad, oportunidad. Estos rasgos permiten que los datos disponibles sean útiles en su función original, pero también que puedan ser reutilizados en fines diferentes a los que fueron creados, apuntando hacia uno de los principios de funcionamiento de la Sociedad de la información y el conocimiento. Existen modelos para evaluar la calidad de los datos abiertos. Uno es el índice OUR-Data de la OCDE destinado a medir la capacidad de disponibilidad, de accesibilidad, y el apoyo gubernamental a la reutilización de los datos. Otro modelo es el de las cinco estrellas de calidad de los datos creado por Tim Berners Lee. Los datos públicos de Chile han adoptado estos lineamientos, por ejemplo, la normalización de los nombres de comunas y regiones del país; la asignación del Código Único Territorial (CUT). Lo mismo ocurre en las encuestas nacionales que utilizan códigos estándares internacionales, tales como, el Código país; la Clasificación Internacional Normalizada de Educación (CINE); el Clasificador de Actividades Económicas Nacional para Encuestas Sociodemográficas (CAENES), el Clasificador Chileno de Actividades Económicas (CIIU4), la Clasificación de productos de la ONU y otros más.

Esta entrada profundiza en la clasificación de productos utilizada en la plataforma digital Mercado Público. El sistema de datos abiertos de las compras públicas de los organismos compradores de bienes y servicios que ejecutan el gasto público en Chile. En ella los productos adquiridos son clasificados de acuerdo a las indicaciones de la ONU que permiten comparar fácilmente las compras efectuadas por los organismos del Estado. Hoy nos enfocamos en el conjunto de productos adquiridos por los organismos compradores durante marzo de 2025. En los dataset mensuales de Mercado Público la definición del producto queda representada en las categorías: codigoProductoONU, NombreroductoGenerico (sic), y RubroN1, RubroN2 y RubroN3. Lo que significa que un mismo producto comprado tiene (o debería tener) los mismos datos en estas categorías. Por ejemplo, la compra de diésel se registra con, NombreProducto: Diesel; CodigoProductoONU: 15101505; RubroN1: Combustibles, lubricantes y anticorrosivos; RubroN2: Combustibles líquidos; RubroN3: Petróleo y derivados.

Los datos de marzo de 2025 indican que se realizaron 151.600 órdenes de compra que solicitaron 429.273 productos, 364.855 productos con el código ONU registrado y 64.418 que no lo tienen, el 15% de los productos solicitados. Los 364.855 productos con código producto ONU corresponden a 9.756 productos distintos, en cambio los 64.418 productos sin código ONU corresponden a 21.795 productos distintos. El análisis de hoy presta atención a este hecho, ¿por qué un conjunto menor de productos contiene una diversidad mayor? Porque aquel conjunto de productos tiene un nombre (NombreroductoGenerico) que no corresponde al nombre del producto genérico al que pertenece, sino que contiene una descripción que específica el producto con la marca, la unidad de medida, la región del comprador más otros detalles. En la Tabla 1 vemos que un mismo organismo (Universidad de Chile) compró Brownie. En una orden de compra lo clasifica como un producto genérico «Galletas dulces o pastelitos”; en las otras dos ordenes de compra lo clasifica como producto específico: «QUEQUE NUTRABIEN BROWNIE CHOCOLATE 62 G UNIDAD RM» y «QUEQUE BRAUNI NUTRABIEN BROWNIE BOLSA 62 G UNIDAD RM» (sic). En las dos últimas descripciones se puede apreciar la marca (NUTRABIEN), unidad de medida (62 gramos) y región del organismo comprador (Región Metropolitana).

En suma, los 21.795 productos clasificados sin el código ONU están incluidos en los 9.756 productos que tienen código ONU y esto presenta un problema al momento de analizar las compras por tipo o clase de productos. Por ejemplo, si se desea conocer el gasto de un organismo comprador de «Galletas dulces o pastelitos» no basta con saber que el código del producto es 50181905 sino que es necesario conocer todas las otras formas en que se han clasificado estos tipos de productos como las dos que hemos mencionado.

A continuación, la Tabla 2 muestra la compra del combustible «Diesel» y las formas que utilizó el organismo comprador (la municipalidad) para clasificarlo en las órdenes de compra del período analizado.

El problema se ve agravado si el análisis considera las cantidades adquiridas en lugar de los montos involucrados. En este caso entran en juego las unidades de medida asociadas a los productos. En el ejemplo de las órdenes de compra de diésel de marzo de 2025 (Código Producto ONU, 15101505) se registraron siete unidades de medida: Unidad no definida, Unidad Internacional, Unidad, Tambor, Mes, Litro, Global (sic). Otro problema que aparece, y que afecta de igual manera que el análisis por monto o cantidad, es la asignación inadecuada en la clasificación de los productos por parte de los organismos compradores. Vemos en el primer caso mencionado que el producto «Brownie» está clasificado como: «Galletas dulces o pastelitos», «Cafetería», «Servicios de suministros de alimentos», «Dulces con azúcar o sustitutos».

El último ejemplo aborda los nombres de los productos genéricos, en algunos casos, productos con igual código ONU aparecen con el nombre de producto genérico distinto porque el nombre aparece cortado en una cantidad fija de caracteres (cincuenta caracteres). La Tabla 3 presenta el caso del producto (50192902) que aparece con tres nombres distintos: “pasta o tallarines natural estable sin refrigerar”, “pasta o tallarines naturales estables sin refriger” y “pasta o tallarines naturales estables sin refrigerar”. Las diferencias no son atribuibles a errores humanos sino que a las distintas aplicaciones utilizadas para registrar las órdenes de compras.

Hemos planteado que la necesidad de reutilización de los datos no sólo necesita emplear las categorías estándares establecidas, por ejemplo, la clasificación ONU de productos. Porque en ciertos casos, como hemos visto en el sistema de compras públicas de Mercado Público, existen clasificaciones anteriores que son difíciles de modificar. En otros casos las prácticas de registro contienen definiciones que alteran el comportamiento que se desea implementar, como ocurre en el ejemplo de la Tabla 3, en que el código de producto ONU tiene el nombre truncado al estar sujeto a una cantidad fija de caracteres. Estos inconvenientes van debilitando la capacidad de búsqueda en el conjunto de datos y reducen la calidad en relación a la exactitud, integridad, coherencia, confiabilidad, accesibilidad. Esas dificultades de los datos abiertos nacionales han quedado capturadas en las evaluaciones internacionales de su calidad. Así lo exhiben los resultados de Chile en el índice OCDE- OUR Data del 2024. En que el  pilar de calidad mejor evaluado fue la disponibilidad de los datos, mientras los otros pilares (accesibilidad y apoyo gubernamental a la reutilización de los datos) mostraron deficiencias. Las debilidades en los registros de las órdenes de compra de Mercado Público no pueden ser catalogados de cuestiones menores, porque son precisamente ese tipo de aspectos los que conforman la huella digital del Estado de Chile, y revelan una serie de inconvenientes que afectan el uso de los datos abiertos nacionales a la hora de combinarlos con datos de otras fuentes para ampliar los ámbitos de análisis, en otras palabras, cuando se necesita agregarles valor. Con lo cual, además, contradicen el esfuerzo sostenido del conjunto de políticas públicas implementadas en esta materia desde la primera década de este siglo en el país.



Deja un comentario

About Me

Paulina es doctora en Ciencias Sociales e investigadora independiente. Actualmente, se dedica al estudio del cambio socio tecnológico en Chile basado en el análisis de datos masivos, principalmente públicos. Hasta febrero de 2022 fue profesora de la Universidad de Concepción (Chile).

Newsletter