Leader di pensiero
Spiegabilità: La prossima frontiera per l’intelligenza artificiale nel settore assicurativo e bancario

Di Dr. Ori Katz, Ricercatore scientifico analitico, Earnix.
“Qualsiasi tecnologia sufficientemente avanzata è indistinguibile dalla magia”, sosteneva lo scrittore di fantascienza Arthur C. Clarke. In effetti, a volte le tecnologie avanzate, come i nuovi algoritmi di apprendimento automatico, sembrano avere proprietà soprannaturali.
Molte aziende sono restie a cambiare i loro modelli analitici tradizionali – e a ragione. La magia è pericolosa, soprattutto se non è ben compresa. Le reti neurali e gli algoritmi di ensemble di alberi decisionali sono “scatole nere”, la cui struttura interna può essere estremamente complessa. Allo stesso tempo, diversi studi [1] hanno dimostrato come le reti neurali e gli algoritmi basati su alberi possano superare anche i modelli di rischio assicurativo tradizionali più curati costruiti da attuari esperti. Ciò è dovuto alla capacità dei nuovi algoritmi di identificare automaticamente strutture nascoste nei dati. Il mistero e l’utilità delle reti neurali e degli algoritmi basati su alberi sono contrastanti. Esiste un trade-off intrinseco tra l’accuratezza di un modello analitico e il suo livello di “spiegabilità”. Come possiamo fidarci di modelli che non possiamo comprendere? Dovremmo semplicemente arrenderci alla magia, sacrificare la nostra fiducia e il controllo su qualcosa che non possiamo pienamente comprendere per l’accuratezza?
I manager e gli analisti non sono gli unici a preoccuparsi di questo trade-off. Negli ultimi anni, i regolatori hanno iniziato a esplorare il lato oscuro della magia per aumentare la loro capacità di monitorare questi settori. I settori assicurativo e bancario sono altamente regolamentati in molti aspetti e le tendenze regolamentari attuali coinvolgono un esame più approfondito dei modelli utilizzati per effettuare previsioni. Il Considerando 71 del Regolamento generale sulla protezione dei dati (GDPR) dell’Unione europea, ad esempio, afferma che i clienti dovrebbero avere il diritto di ottenere una spiegazione di una decisione automatizzata dopo che è stata presa. Da quando è stato introdotto, questo elemento del regolamento è stato al centro di un acceso dibattito accademico.
L’urgente necessità di spiegare i modelli analitici “scatole nere” ha portato all’emergere di un nuovo campo di ricerca: l’Intelligenza artificiale spiegabile. Gli esperti stanno sviluppando strumenti che ci consentono di guardare all’interno della scatola nera e di svelare almeno una parte della magia. Due tipi di strumenti che i ricercatori hanno creato includono strumenti di “spiegabilità globale”, che possono aiutarci a comprendere le caratteristiche chiave che guidano le previsioni del modello nel suo complesso, e strumenti di “spiegabilità locale”, che sono destinati a spiegare una previsione specifica.
Il seguente grafico è un esempio di spiegabilità locale. Si basa sulle idee dell’economista premio Nobel Lloyd Shapley, che ha sviluppato un metodo di teoria dei giochi per calcolare il contributo di più giocatori che cooperano nello stesso compito. Nell’Intelligenza artificiale spiegabile, i “giocatori” sono le caratteristiche del modello, mentre il “compito” è la previsione del modello. I numeri che descrivono il contributo di ogni caratteristica sono chiamati “valori di Shapley”. I ricercatori hanno recentemente sviluppato metodi per la stima rapida dei valori di Shapley [2], che ci consentono di distribuire in modo equo una previsione tra le diverse caratteristiche.
Utilizzo dei valori di Shapley per spiegare la domanda di rinnovo prevista di un cliente specifico

Il grafico, basato su dati simulati, mostra il risultato di un modello di domanda che prevede la probabilità di rinnovo di una polizza assicurativa auto. Questa è una spiegazione locale per un cliente specifico. Il modello di domanda si basa su un complesso ensemble di alberi decisionali, ma il grafico presenta il contributo separato di ogni caratteristica alla previsione finale. In questo esempio, il modello prevede che l’individuo medio nei dati rinnovi la polizza con una probabilità del 64%. Tuttavia, per questo cliente specifico, la probabilità prevista è molto più alta, al 72%. Il grafico ci consente di vedere la causa di questa differenza.
Mentre non possiamo comprendere appieno la struttura interna di questo modello complesso, i valori di Shapley ci consentono di vedere quali sono le caratteristiche più importanti per una previsione specifica, svelando una parte della magia. La media dei valori di Shapley individuali sulla popolazione ci consente di vedere quali caratteristiche sono più importanti e di ottenere una spiegabilità globale del modello. Altri strumenti di spiegabilità popolari includono “Permutation Feature Importance”, modelli surrogati semplici che sono adattati localmente, e esempi controfattuali, per citarne alcuni [3].
Gli strumenti di spiegabilità nuovi sono il passo necessario successivo nell’evoluzione dell’apprendimento automatico. Possono consentire alle compagnie assicurative e alle banche di comprendere e fidarsi dei loro modelli di apprendimento automatico, di conformarsi alle nuove norme, e di fornire ai loro clienti informazioni preziose. Possiamo ora superare parzialmente il trade-off tra accuratezza e spiegabilità e godere dei vantaggi dei nuovi modelli di apprendimento automatico con meno preoccupazioni sulla loro natura di scatola nera.
Nel nostro mondo in rapida digitalizzazione, diventare completamente guidati dall’analisi è il criterio di base per la sopravvivenza per le compagnie assicurative e le banche. Questa capacità è sempre stata importante – ma è diventata vitale con le condizioni di mercato volatile che il 2020 ha portato con sé. Le compagnie assicurative e le banche hanno bisogno di analisi più intelligenti per modellare una realtà complessa e nuova su cui basare le loro decisioni aziendali e servire i loro clienti più velocemente e meglio. Gli strumenti di spiegabilità possono consentire alle compagnie assicurative e alle banche di raggiungere questo obiettivo. Con il tempo, arriveremo al punto in cui i modelli di apprendimento automatico non saranno più considerati magia, ma uno strumento essenziale nell’arsenale di qualsiasi azienda guidata dai dati.
Fonti:
[1] Bärtl, M., & Krummaker, S. (2020). Previsione di sinistri nel finanziamento alle esportazioni: un confronto di quattro tecniche di apprendimento automatico. Risks, 8(1), 22.
Noll, A., Salzmann, R., & Wuthrich, M. V. (2020). Studio di caso: sinistri di responsabilità civile auto in Francia. Disponibile su SSRN 3164764.
Fauzan, M. A., & Murfi, H. (2018). L’accuratezza di XGBoost per la previsione dei sinistri assicurativi. Int. J. Adv. Soft Comput. Appl, 10(2).
Weerasinghe, K. P. M. L. P., & Wijegunasekara, M. C. (2016). Uno studio comparativo degli algoritmi di data mining nella previsione dei sinistri assicurativi auto. European International Journal of Science and Technology, 5(1), 47-54.
[2] Lundberg, S. M., & Lee, S. I. (2017). Un approccio unificato all’interpretazione delle previsioni del modello. In Advances in neural information processing systems (pp. 4765-4774).
[3] Vedi qui per maggiori dettagli: https://christophm.github.io/interpretable-ml-book/index.html












