Investigación liderada por académico FEN David Díaz evalúa la precisión de modelos de lenguaje para evaluar el riesgo crediticio en Chile

Un estudio realizado por académicos de la Universidad de Chile y la CMF reveló que modelos de inteligencia artificial, como ChatGPT, pueden predecir con alta precisión el riesgo de incumplimiento en créditos de consumo.


Recientemente se llevó a cabo el seminario académico “Can Large Language Models Predict Credit Risk? An Empirical Study on Consumer Loans in Chile”, presentado por David Díaz, profesor asociado del Departamento de Administración de la Facultad de Economía y Negocios (FEN) de la Universidad de Chile. El trabajo fue realizado en colaboración con Diego Beas L., profesional de la Comisión para el Mercado Financiero (CMF).


La investigación abordó una pregunta clave para el futuro de las finanzas: ¿puede un modelo de lenguaje como ChatGPT evaluar con precisión el riesgo de que una persona no pague su crédito?
Para responderla, se utilizó una muestra de 10.000 créditos de consumo otorgados entre 2010 y 2020, y se comparó el desempeño de estas herramientas con modelos tradicionales como regresión logística y LightGBM.


IA y riesgo crediticio: más que una moda
Los resultados mostraron que los modelos de lenguaje de gran escala (LLMs), al ser ajustados correctamente (fine-tuning), lograron un desempeño similar al de los modelos clásicos, alcanzando un 80% de precisión en algunas métricas clave. Incluso aquellos modelos sin ajustes previos obtuvieron resultados competitivos, lo que sugiere que esta tecnología podría ser una herramienta útil para bancos y fintechs, incluso sin grandes inversiones técnicas.


Modelos que explican sus decisiones
Un aspecto destacado del estudio fue que los LLMs no solo entregaron predicciones, sino también explicaciones sobre por qué tomaban ciertas decisiones. Estas justificaciones fueron evaluadas por expertos y recibieron una calificación promedio de 5,5 sobre 7, lo que es un hallazgo prometedor respecto de su utilidad interpretativa.


No obstante, el profesor Díaz fue enfático en señalar que la supervisión humana sigue siendo esencial. Los modelos pueden apoyar la toma de decisiones, pero no deben reemplazar el juicio profesional ni la revisión regulatoria y que todavía existe mucho trabajo por hacer respecto de validar los resultados en otros contextos y condiciones.


Aplicaciones prácticas y accesibilidad para pequeñas instituciones
Los investigadores concluyen que esta tecnología podría democratizar el análisis de riesgo, permitiendo que instituciones con menos recursos, tales como empresas que otorgan líneas de crédito a sus clientes o fintechs, accedan a evaluaciones automatizadas, eficientes y comprensibles.
Entre sus posibles aplicaciones futuras destacan:
• Automatización del proceso de evaluación crediticia.
• Mayor transparencia en la aprobación o rechazo de un crédito.
• Generación de reportes explicativos para supervisores.
• Implementación rápida en organizaciones sin equipos técnicos complejos.

Este estudio forma parte de la agenda de investigación aplicada impulsada por el Departamento de Administración de FEN U. de Chile, consolidando su liderazgo en la intersección entre inteligencia artificial, finanzas y política pública.