Contratación 360 - Aplicando la ciencia de datos en la gestión pública transparente


Resumen del proyecto de grado de la Maestría en Inteligencia Analítica de Datos de la Universidad de los Andes

Tabla: Integrantes Grupo


Video: Presentación


1 Introducción

Contratación 360 es una solución integral diseñada para abordar el desafío de una gestión pública transparente y eficiente en Colombia, aprovechando los beneficios de los datos abiertos y el machine learning para liberar el poder de la información en contratación.

En Colombia, anualmente se destina una cantidad superior a los 20 billones de pesos para inversiones en infraestructura a través de la asignación de recursos públicos a entidades privadas. Sin embargo, durante el período entre 2016 y 2019, se requirieron 6 billones de pesos adicionales debido a prórrogas en el tiempo y adiciones presupuestales, lo cual plantea un desafío para lograr una gestión eficiente y transparente de los recursos públicos.

2 Propuesta de Valor

Con el objetivo de contribuir al mejoramiento de la gestión pública, se desarrolló una herramienta que identifica características clave en los contratos de obra. Esto permite anticipar posibles desafíos como sobrecostos y retrasos en la ejecución de los proyectos. 

Nuestra solución busca promover la eficiencia y la transparencia en la contratación pública, generando beneficios para el sector y optimizando la asignación de recursos.

Se basa en el análisis de datos históricos para comparar los montos presupuestados contra los montos realmente ejecutados en contratos anteriores. A través predicciones generadas en etapas de borrador, aprobación o inicio de ejecución de contratos, se identifican riesgos potenciales, como adiciones y prórrogas, brindando información para los responsables de la ejecución y la auditoría. Además, esta información es valiosa para los entes de control, permitiéndoles enfocar sus esfuerzos de manera más efectiva.

La herramienta cuenta con dos componentes clave: un cuadro interactivo descriptivo con clusterización y un aplicativo de predicción. El cuadro descriptivo proporciona información segmentada sobre los contratos con características similares entre sí, facilitando su entendimiento y muestra información relacionada con sanciones disciplinarias, contractuales y fiscales de cada contratista. El aplicativo de predicción permite calcular la probabilidad de tener adiciones o prórrogas.

En conclusión, la propuesta de valor radica en la capacidad de la herramienta para detectar, analizar, prevenir y mitigar los riesgos presentes en los contratos públicos, al tiempo que se aprovechan los beneficios de la política de datos abiertos.

Invertir en herramientas, que utilizan datos abiertos de la contratación pública, es un movimiento estratégico que ofrece una multitud de ventajas. Al revelar de manera transparente la asignación de los fondos de los contribuyentes, la contratación abierta mejora la responsabilidad estatal, la justicia procesal y la confianza pública en las instituciones. Además, fomenta la competencia al reducir los costos de información y el riesgo en la inversión. También aumenta significativamente la eficiencia institucional al agilizar las solicitudes de información, beneficiando a las entidades gubernamentales, los organismos encargados de hacer cumplir la ley y los organismos de control de la sociedad civil.

3 Prototipo Contratación 360

Aplicativo: https://app.powerbi.com/view?r=eyJrIjoiNDhjMWViZmItY2MwZi00YzZmLTg0ZWQtOGM2ZDYxZGU2NzI5IiwidCI6IjQzZjM1MDE5LTk0MzgtNDM4OC1iYWIwLTRlN2M5MWJjZTBjMyJ9

Manual de usuario y de mantenimiento:
https://github.com/alfarodaniel/Contratacion_360/blob/main/Manual_de_usuario.pdf

Nuestra solución contempla las siguientes funcionalidades clave:

3.1 Presentación del contexto de la contratación pública

Imagen: Captura de pantalla del aplicativo

Se presentan datos agrupados de la contratación de 2016 a 2019, se muestra la problemática de las adiciones y prórrogas haciendo un comparativo con el costo de las viviendas VIS y se propone utilizar datos abiertos en conjunto con machine learning para proponer una solución a la problemática planteada.

3.2 Entendiendo la contratación pública por medio de clustering

Imagen: Captura de pantalla del aplicativo

El modelo descriptivo utilizado en este proyecto se basa en técnicas de clustering para identificar relaciones entre variables y agruparlas de forma comprensible para los usuarios. Se emplearon métricas como el Silhouette Score y el Índice de Davies-Bouldin para evaluar y mejorar los resultados del clustering. El objetivo es proporcionar a los usuarios una visión clara y fácilmente interpretable de las relaciones y agrupaciones dentro de los datos de contratación.

3.3 Detalle de datos por contratista e histórico de sanciones

Imagen: Captura de pantalla del aplicativo

Evidencia de sanciones disciplinarias, contractuales y fiscales relacionadas por contratista.

3.4 Prediciendo la probabilidad de tener adiciones y prórrogas

Imagen: Captura de pantalla del aplicativo

Se han desarrollado dos modelos predictivos: uno para predecir el riesgo de adiciones presupuestales y otro para predecir el riesgo de prórrogas en los contratos. Se utilizan herramientas como Permutation Based Feature Importance y SHAP para el análisis y selección de variables predictoras relevantes. Ambos modelos se basan en técnicas de clasificación y utilizan datos históricos de contratación. Los usuarios pueden ingresar opciones y obtener predicciones sobre las probabilidades de que un contrato presente adiciones presupuestales o prórrogas. Estas predicciones ayudan a tomar decisiones informadas para mejorar la eficiencia en la contratación y generar ahorros.

3.5 Llamado a la acción

Los usuarios interesados en analizar la eficiencia en la contratación pública y obtener información sobre adiciones presupuestales y prórrogas pueden acceder al repositorio y utilizar la herramienta. Se anima a los usuarios a explorar el tablero de control, utilizar en él los modelos descriptivos y predictivos, y utilizar los resultados para mejorar la toma de decisiones en la contratación.

4 Costos

En cuanto a los costos, los modelos descriptivos y predictivos se desarrollaron utilizando librerías públicas de Python, por lo que su mantenimiento no implica costos adicionales de licencias. Por otro lado, el cuadro de control se creó en Power BI, que requiere licenciamiento, pero permite compartirlo públicamente con la mayoría de sus funcionalidades.

5 Riesgos

Los riesgos asociados con la herramienta se relacionan principalmente con la resistencia al cambio por parte de los usuarios al utilizar nuevas herramientas y el riesgo de restricción en el acceso limitado a los datos abiertos, los cuales pueden variar con el tiempo.

6 Condiciones de adopción / despliegue

Para la adopción y despliegue de la herramienta, es necesario implementar una estrategia de sensibilización sobre la importancia de disponer de datos abiertos y fortalecer su acceso y crecimiento. Además, es fundamental contar con personas que posean las competencias necesarias para aprovechar al máximo la herramienta mediante el análisis de datos.

7 Tabla de requerimientos - lista de chequeo

Ver “Tabla de requerimientos - Etapa inicial - Prototipo” en el documento “Tabla de requerimientos” en el repositorio.

8 Mejoras

A partir del prototipo realizado se proponen las siguientes mejoras:

  • Se podrían utilizar otros modelos para mejorar el resultado de los modelos actuales, especialmente ensamblar diferentes modelos.

  • Utilizar un software libre que no requiera licenciamiento para facilitar el uso y la navegación de los usuarios.

  • Actualizaciones en tiempo real: Configurar el tablero para que se actualice automáticamente en tiempo real o con frecuencia periódica, lo que permitirá a los usuarios obtener información actualizada y tomar decisiones basadas en datos en tiempo real.

  • Alertas y notificaciones: Incorporar un sistema de alertas y notificaciones que advierta a los usuarios sobre cambios significativos en los datos de los contratos. 

  • Integración de fuentes de datos adicionales: Ampliar el alcance del tablero incluyendo datos de fuentes adicionales relevantes como los entes de control como Fiscalía, Contraloría y Policía.

  • Acceso móvil: Optimizar el tablero para que sea accesible desde dispositivos móviles, lo que permite a los usuarios acceder a la información y tomar decisiones sobre la marcha, sin estar limitados a un escritorio.

  • Adicionar más gráficas descriptivas que permitan al usuario un mayor entendimiento de los procesos de contratación, para mejorar la toma de decisiones. 

9 Repositorio

En el repositorio de GitHub se encuentran varios archivos de datos utilizados en el proyecto:

9.1 Carpeta Code

9.2 Carpeta Data

  • CoordenadasDepartamentosRegiones.csv: Listado sobre los departamentos, latitud, longitud y región.

  • Grupos.csv:  Listado de tipos de contrato con imágenes para visualización

  • Identificacion.csv: Listado de contratistas utilizado por el robot de PACO.

  • PACO.csv: Listado resultante del robot PACO con información de identificación de contratista, disciplinarias, contractuales y fiscales.

  • PCA_KMEANS_SECOP_I.zip: archivo que contiene información sobre la clusterización realizada.

  • Predicciones.csv: archivo de predicciones que permite al usuario ingresar opciones y obtener las probabilidades de que un contrato presente adiciones presupuestales o prórrogas.

  • SECOP_I_part1.csv: Listado descargado de SECOP I, con información sobre la Contratación Pública en Colombia, que ha sido utilizada en el análisis y desarrollo de los modelos descriptivos y predictivos (parte 1 de 8).

Comentarios