Índice de Calidad de Información de los Pagos
¿Qué es?
Es una nota entre 0 y 100 que se calcula cada mes para medir el nivel de detalle y calidad con que se describen los pagos de cada institución. El índice será menor para las instituciones que no expliquen claramente sus pagos
¿Cómo se calcula?
El índice se encuentra para el año 2021 en una fase de desarrollo y consulta, para estudiar con detalle lo que los usuarios de Café Claro consideran “información de calidad”. En su versión actual es el promedio normalizado de un conjunto de propiedades de calidad que se describen a continuación. Varias de estas propiedades se determinan mediante técnicas de procesamiento del lenguaje natural e inteligencia artificial. Para una descripción técnica del índice ver aquí (enlace repo).
- Pago con proveedor indirecto: Cuando en el registro de pago aparece una institución financiera como receptora del pago, cuando esta es simplemente intermediaria de un proveedor final. Aunque a nivel operativo o contable esto puede ser normal, a nivel informativo, dificulta la identificación del proveedor final que cuando aparece viene mezclado en el texto de descripción sin posibilidad de realizar filtros u operaciones de agregación con métodos tradicionales
- Relevancia del texto descripción: Se considera la importancia relativa de las palabras que aparecen en la descripción del pago. Por ejemplo, las palabras “pago” o “factura” son poco relevantes porque aparecerán en la mayoría de las descripciones. Sin embargo las palabras “combustible” o “computadora” aportan más información porque estarán en pagos específicos y podemos identificar el objeto o motivo del pago
- Longitud informativa: Se mide la cantidad de texto que realmente es informativo, dado que hay descripciones que son más explícitas que otras. Por ejemplo “pago factura 045” y “reemplazo de rotulación de cristales y puertas” pueden ser descripciones de un mismo pago, pero el segundo, después de eliminar las palabras irrelevantes, es más explícito.
- Términos no reconocidos: Se considera la frecuencia que aparece texto abreviado, caracteres no alfabéticos en palabras y otros errores que dificultan la interpretación del lenguaje tanto para humanos como programas de procesamiento del lenguaje. Por ejemplo “Pago fact. a/f bufete ABC p/hon. ases legal” tiene la misma información que “Asesoría legal de bufete ABC” y la segunda es más legible.
Para la versión del índice que se prepara para el 2022 se pretenden incorporar nuevas propiedades de calidad que enriquezcan y profundicen en la interpretabilidad y nuestra capacidad de poder clasificar los pagos en diferentes categorías.
¿Por qué lo calculamos?
Porque nos permite expresar de forma sencilla la facilidad o dificultad que tenemos para el monitoreo del gasto público a través de los datos que genera cada institución. Las instituciones podrán verse reflejadas en el índice e intentar generar información de más calidad en el curso normal de sus actividades y operaciones. De forma concreta aspiramos a que:
- Tesorería Nacional, en coordinación con la institución que genera el dato dato de los pagos, diferencien entre receptores de pago y proveedores finales de forma clara y transparente
- Las instituciones en el medio plazo mejoren el lenguaje en reconocimiento de que sus operaciones son información de uso público
- Las instituciones sean explícitas en cuanto a la motivación, objeto y características de los pagos, de modo que sea reconocible el destino de los fondos públicos con menos requerimientos de información adicional.
¿Cómo puedo utilizarlo?
Lo más fácil para el índice es divulgarlo y requerir de forma específica a las instituciones que intenten mejorar su nota en el medio plazo. También sugerimos aportar nuevas ideas de propiedades de calidad que permitan fortalecer el índice para su próxima versión.