Accuracy of explanations of machine learning models for credit decisions

Alonso-Robisco, Andres; Carbó, José Manuel

Ver

1,27 MB

Registro completo de metadatos

Campo DC	Valor
dc.contributor.author	Alonso-Robisco, Andres
dc.contributor.author	Carbó, José Manuel
dc.date.accessioned	2022-06-23T19:02:19Z
dc.date.available	2022-06-23T19:02:19Z
dc.date.issued	2022-06-23
dc.identifier.issn	ISSN: 1579-8666 (en línea)
dc.identifier.issn	ISSN: 0213-2710 (en papel)
dc.identifier.uri	https://repositorio.bde.es/handle/123456789/22517
dc.description.abstract	Uno de los principales retos en el uso de modelos de aprendizaje automático, o machine learning en inglés (ML), en finanzas es cómo explicar sus resultados. Recientemente han aparecido técnicas de interpretabilidad con este objetivo, pero existe discusión sobre su fiabilidad. En este documento contribuimos al debate proponiendo una metodología para evaluar la precisión de estas técnicas de interpretabilidad. Partimos de la generación de conjuntos de datos sintéticos, siguiendo un enfoque que nos permite controlar la importancia de cada variable explicativa (feature) en nuestra variable objetivo. Al definir nosotros la importancia de las features, podemos posteriormente calcular en qué medida las explicaciones dadas por las técnicas de interpretabilidad coinciden con la verdad subyacente. Por lo tanto, si en nuestro conjunto de datos sintéticos definimos una feature como relevante para la variable objetivo, la técnica de interpretabilidad también debería identificarla como una feature relevante. Desarrollamos un ejemplo empírico en el que generamos conjuntos de datos sintéticos de manera que se parezcan a datos de suscripción y calificación crediticia, donde la variable objetivo es una variable binaria que representa el incumplimiento del solicitante. Usamos modelos de ML no interpretables, como redes neuronales, para predecir el incumplimiento, y luego explicamos sus resultados usando dos técnicas populares de interpretabilidad, SHAP y permutation Feature Importance (FI). Nuestros resultados usando la metodología propuesta sugieren que SHAP identifica mejor las variables relevantes como tales, aunque los resultados pueden variar significativamente según las características del conjunto de datos y el modelo ML utilizado. Concluimos que el recurso a la generación sintética de bases de datos muestra un elevado potencial para supervisores y entidades financieras que precisen evaluar la fidelidad de estas técnicas.
dc.description.abstract	One of the biggest challenges for the application of machine learning (ML) models in finance is how to explain their results. In recent years, different interpretability techniques have appeared to assist in this task, although their usefulness is still a matter of debate. In this article we contribute to the debate by creating a framework to assess the accuracy of these interpretability techniques. We start from the generation of synthetic data sets, following an approach that allows us to control the importance of each explanatory variable (feature) in our target variable. By defining the importance of features ourselves, we can then calculate to what extent the explanations given by the interpretability techniques match the underlying truth. Therefore, if in our synthetic dataset we define a feature as relevant to the target variable, the interpretability technique should also identify it as a relevant feature. We run an empirical example in which we generate synthetic datasets intended to resemble underwriting and credit rating datasets, where the target variable is a binary variable representing applicant default. We then use non-interpretable ML models, such as deep learning, to predict default, and then explain their results using two popular interpretability techniques, SHAP and permutation Feature Importance (FI). Our results using the proposed framework suggest that SHAP is better at interpreting relevant features as such, although the results may vary significantly depending on the characteristics of the dataset and the ML model used. We conclude that generating synthetic datasets shows potential as a useful approach for supervisors and practitioners looking for solutions to assess the interpretability tools available for ML models in the financial sector.
dc.format.extent	45 p.
dc.language.iso	en
dc.publisher	Banco de España
dc.relation.ispartof	Documentos de Trabajo / Banco de España, 2222
dc.rights	Reconocimiento-NoComercial-CompartirIgual 4.0 Internacional (CC BY-NC-SA 4.0)
dc.rights	In Copyright - Non Commercial Use Permitted
dc.rights.uri	https://creativecommons.org/licenses/by-nc-sa/4.0/deed.es_ES
dc.rights.uri	http://rightsstatements.org/vocab/InC-NC/1.0/
dc.subject	Datos sintéticos
dc.subject	Inteligencia artificial
dc.subject	Interpretabilidad
dc.subject	Aprendizaje automático
dc.subject	Evaluación de crédito
dc.subject	Synthetic datasets
dc.subject	Artificial intelligence
dc.subject	Interpretability
dc.subject	Machine learning
dc.subject	Credit assessment
dc.title	Accuracy of explanations of machine learning models for credit decisions
dc.type	Documento de trabajo
dc.identifier.bdebib	000472967
dc.identifier.bdepub	DTRA-202222-eng
dc.subject.bde	Créditos
dc.subject.bde	Modelización econométrica
dc.subject.bde	Técnicas informáticas
dc.publisher.bde	Madrid : Banco de España, 2022
dc.subject.jel	C55
dc.subject.jel	C63
dc.subject.jel	G17

Aparece en las colecciones:

Documentos de Trabajo 2022

Modal title