Intelligenza artificiale

L’AI offre un miglioramento della tracciabilità della proprietà offshore nel Regno Unito

mm

Nuove ricerche condotte da due università del Regno Unito mirano a gettare maggiore luce sullo stato potenziale del riciclaggio di denaro basato sulla proprietà nel Regno Unito, in particolare nel mercato immobiliare londinese molto ambito.

Secondo i risultati del progetto, il numero totale di proprietà domestiche “non convenzionali” (ovvero proprietà che non vengono utilizzate a lungo termine come abitazioni da parte dei proprietari o degli inquilini) ammonta a circa 138.000 a Londra sola.

Questo numero è del 44% superiore alle cifre ufficiali, che sono fornite e aggiornate periodicamente dal governo del Regno Unito.

I ricercatori hanno utilizzato varie tecniche di Natural Language Processing (NLP), insieme a dati aggiuntivi e ricerche corroborative, per estendere le informazioni ufficiali limitate che il governo del Regno Unito mette a disposizione sulla percentuale, sul valore, sulla localizzazione e sui tipi di proprietà di proprietà di società offshore nel Regno Unito, le più lucrative delle quali si trovano nella capitale.

La ricerca ha scoperto che il totale delle proprietà offshore, a basso utilizzo e di tipo Airbnb (ovvero “occupazione occasionale”) nel Regno Unito sono collettivamente valutate tra 145-174 miliardi di sterline GBP, su circa 144.000-164.000 proprietà.

Ha anche scoperto che le proprietà offshore di questo tipo sono generalmente più costose e presentano modelli di firma in relazione alla loro localizzazione nel Regno Unito.

I ricercatori stimano che la proprietà domestica “non convenzionale” (UDP) di proprietà di società offshore rappresenti il 7,5% del valore domestico totale, e che 56 miliardi di sterline del valore stimato sono limitati a sole 42.000 abitazioni.

Il documento afferma:

‘Le singole proprietà offshore sono molto costose anche secondo gli standard della UDP, inoltre sono concentrate al centro di Londra con una forte autocorrelazione spaziale.

‘Al contrario, la proprietà offshore annidata è leggermente meno concentrata al centro di Londra, ma più altamente concentrata in generale, e non presenta quasi alcuna correlazione spaziale.’

L’analisi dei dati aumentati mostra che un gran numero di proprietà offshore appartengono a entità nelle Dipendenze della Corona (CD), con il secondo numero più grande rappresentato dai Territori d’Oltremare britannici (nella tabella sottostante, ‘PWW2’ indica i paesi che hanno ottenuto l’indipendenza dalla Gran Bretagna dopo la seconda guerra mondiale).

Disposizione della proprietà straniera, secondo i risultati del nuovo documento. Fonte: https://arxiv.org/src/2207.10931v1/anc/Offshore_London_Supplementary_Material.pdf

Disposizione della proprietà straniera, secondo i risultati del nuovo documento. Fonte: https://arxiv.org/src/2207.10931v1/anc/Offshore_London_Supplementary_Material.pdf

Il documento osserva:

‘In realtà, solo 4 territori, Isole Vergini Britanniche, Jersey, Guernsey e Isola di Man, sono associati al 78% di tutte le proprietà.’

I nuovi dati aumentati hanno reso possibile determinare le sottoproprietà che esistono all’interno di una proprietà offshore nota – una capacità generalmente ostacolata dai dati ufficiali piatti e limitati.

I risultati indicano anche che le proprietà offshore, Airbnb e a basso utilizzo sono notevolmente più concentrate geograficamente delle case normali e sono inoltre concentrate in aree ad alto valore.

Mappe di calore relative a vari tipi di proprietà di proprietà straniera a Londra. Fonte: https://arxiv.org/pdf/2207.10931.pdf

Mappe di concentrazione visualizzate relative a vari tipi di proprietà di proprietà straniera a Londra. Fonte: https://arxiv.org/pdf/2207.10931.pdf

Riguardo alla tabella sopra, gli autori commentano:

‘La proprietà domestica offshore ha alcune concentrazioni estremamente elevate dove un’intera area residenziale è di proprietà di una società offshore.’

Gli autori hanno rilasciato il codice per la loro pipeline di elaborazione.

Il nuovo documento è intitolato Cosa c’è nella lavanderia? Mappatura e caratterizzazione della proprietà domestica di proprietà di società offshore a Londra, e proviene da ricercatori della Facoltà di Ambiente Costruito di The Bartlett dell’University College di Londra e del Dipartimento di Economia dell’Università di Kingston.

Addressing the Problem

Gli autori notano che dopo decenni di sforzi per controllare l’uso della proprietà immobiliare a scopo di riciclaggio di denaro nel Regno Unito, ci è voluto il rilascio di un elenco di proprietà di proprietà di società offshore nel Regno Unito da parte della pubblicazione britannica Private Eye nel 2015 per spingere il governo del Regno Unito a pubblicare un elenco aggiornato regolarmente di proprietà di proprietà di società offshore nella maggior parte del Regno Unito, noto come Società straniere che possiedono proprietà in Inghilterra e Galles (OCOD).

I ricercatori osservano che sebbene l’OCOD sia un passo avanti nella ricerca e nell’analisi della proprietà di proprietà di società offshore e del potenziale riciclaggio di denaro nel Regno Unito, i dati presentano una serie di limitazioni, alcune delle quali cruciali:

‘Questi indirizzi possono essere incompleti, contenere proprietà annidate, dove più proprietà esistono all’interno di un singolo numero di titolo o di riga, inoltre non contiene informazioni su whether la proprietà sia domestica, commerciale o altro.

‘Tali dati di scarsa qualità rendono difficile comprendere la distribuzione e le caratteristiche della proprietà di proprietà di società offshore nel Regno Unito.’

È particolarmente difficile ottenere dati su proprietà affittate occasionalmente, come ad esempio le proprietà Airbnb, poiché i dati pubblicamente disponibili sono limitati o inesistenti. Inoltre, la Scozia (una parte del Regno Unito) non rende pubblicamente disponibile il proprio registro delle vendite di proprietà, a differenza dell’Inghilterra e del Galles.

Per contrastare alcune delle incoerenze relative alla classificazione delle proprietà, il governo del Regno Unito ha introdotto il sistema di riferimento unico della proprietà (UPRN), progettato per consentire relazioni più chiare tra diverse fonti di dati sulla proprietà. Tuttavia, gli autori notano* ‘sebbene l’uso dell’UPRN sia obbligatorio, quasi nessun dipartimento governativo lo utilizza, il che significa che il collegamento dei dati richiede capacità di elaborazione dei dati avanzate avanzate abilità.

Pertanto, la nuova ricerca ha cercato di rendere i dati più granulari e più significativi.

Raccolta e connessione dei dati

All’interno di qualsiasi paese, i formati degli indirizzi sono generalmente prevedibili e coerenti, applicabili anche agli indirizzi del Regno Unito. Pertanto, di fronte a dati di indirizzi “piatti” e basati su testo (come quelli forniti dall’OCOD), sono emerse diverse soluzioni di parsing degli indirizzi open source per cross-referenziare gli indirizzi ad altre fonti di dati.

Tuttavia, molte di queste sono state formate utilizzando i dati di Open Street map, che possono produrre indirizzi che possono effettivamente ospitare decine o addirittura centinaia di sottindirizzi annidati (come ad esempio appartamenti in un ampio indirizzo per un blocco di appartamenti). Di conseguenza, anche un noto parser di indirizzi come libpostal ha avuto difficoltà quando ha tentato di analizzare gli indirizzi incompleti.

Per creare il parser per il loro progetto, i ricercatori del nuovo documento hanno utilizzato una serie di set di dati pubblicamente disponibili. I dati chiave sono stati forniti dall’OCOD, mentre il componente di pulizia dei dati ha utilizzato il set di dati dei prezzi di vendita del Land Registry (dataset), insieme al set di dati delle valutazioni VOA (VOA ratings) e il Directory dei codici postali dell’Office of National Statistics (ONSPD).

I dati di Airbnb provengono dal dominio InsideAirbnb, che include solo case intere che vengono affittate, escludendo quindi l’uso originariamente previsto per Airbnb (ovvero l’affitto di una parte o dell’intera propria casa su base occasionale).

Il set di dati delle proprietà a basso utilizzo degli autori è stato aumentato dalle informazioni ricevute da richieste di informazioni gratuite (FOI) di successo, in gran parte raccolte per un progetto precedente.

I dati di base dell’OCOD sono un file CSV delimitato da virgole con un buon grado di struttura e formato prevedibile.

La pipeline consisteva in cinque fasi: etichettatura, parsing, espansione, classificazione e contrazione. All’inizio, qualsiasi indirizzo individuale poteva risolversi nella vita reale in più proprietà annidate, sebbene ciò non sia esplicito nei dati forniti dal governo.

I ricercatori hanno eseguito una leggera pre-elaborazione sintattica, quindi hanno importato i dati in programmatic, una piattaforma progettata per creare set di dati NLP annotati senza etichettatura manuale. Qui, le entità sono state etichettate utilizzando espressioni regolari (Regex) per descrivere otto tipi di entità nominata (vedi immagine sotto):

Con queste etichette aggiunte, il set di dati è stato estratto come un file JSON, con le sovrapposizioni delle etichette rimosse da semplici routine basate su regole.

Inoltre, l’output di programmatic è stato utilizzato per formare un modello predittivo per SpaCy, sostenuto da Facebook RoBERTa. Una volta desensibilizzato, i ricercatori hanno creato un set di confronto della verità di 1000 osservazioni etichettate casualmente. Il punteggio di accuratezza dei dati non supervisionati sarebbe stato valutato contro questa verità.

L’analisi degli indirizzi ha presentato una serie di sfide. Gli autori hanno assegnato a ogni intervallo di caratteri la propria riga e a ogni classe di etichetta la propria colonna, quindi hanno eseguito il backpropagation delle colonne per generare righe di indirizzi complete.

Poiché alcuni singoli indirizzi presentavano più abitazioni distinte, è stato necessario espandere il database, suddividendo gli indirizzi unici in sottoproprietà presenti in database complementari.

Dopo di ciò, la fase di classificazione degli indirizzi ha cross-referenziato tutti gli indirizzi ubicati utilizzando il database ONSPD. Questo processo collega i dati degli indirizzi ai dati demografici e censuari, e individua anche le sottoproprietà che in precedenza erano nascoste dietro gli indirizzi opachi dei dati OCOD.

Infine, il processo di contrazione degli indirizzi ha filtrato tutte le proprietà non domestiche (ovvero i locali commerciali) dai gruppi di proprietà annidate.

Analisi

Per testare l’accuratezza dei dati aumentati, gli autori, come menzionato in precedenza, hanno creato un set di verità di campione che è stato trattenuto dall’analisi generale, e utilizzato solo per testare l’accuratezza delle previsioni e delle analisi.

La verifica manuale per la verità ha incluso l’uso di software di mappe, nonché l’analisi di immagini delle proprietà presenti nel set trattenuto, e di ricerche su Internet per valutare il tipo di proprietà. Successivamente, le prestazioni dei dati sono state misurate contro punteggi di precisione, richiamo e F1.

Il valore delle proprietà a basso utilizzo e domestiche è stato ottenuto con un modello grafico di base, lo stesso metodo utilizzato anche per inferire le proprietà UDP.

Il compito NER, testato contro la verità di alto sforzo, etichettata manualmente, ha ottenuto un punteggio F1 di 0,96 (vicino al ‘100%’, in termini di accuratezza).

Per quanto riguarda le UDP a Londra, i risultati finali mostrano un totale di 138.000 voci – il 44% in più rispetto alle 94.000 presenti nel set di dati OCOD originale (ovvero le cifre ufficiali recenti).

I risultati indicano che il valore totale delle proprietà offshore si attesta intorno a 56 miliardi di sterline, mentre il valore totale delle proprietà a basso utilizzo è stimato a 85 miliardi di sterline.

Gli autori notano:

‘[Tutte] le UDP sono molto più costose della media dei prezzi delle proprietà convenzionali di 600.000 sterline.’

Questo tipo di dati migliorati può essere necessario per contrastare l’uso della speculazione immobiliare come attività di riciclaggio di denaro nel Regno Unito. Gli autori notano il crescente corpo di ricerche e letteratura generale che suggerisce che i dati migliorati possono aiutare a contrastare la speculazione immobiliare AML, e concludono:

‘Questi dati possono essere utilizzati da sociologi, economisti e responsabili delle politiche per assicurarsi che i tentativi di ridurre il riciclaggio di denaro e i prezzi elevati delle proprietà siano basati su dati dettagliati che riflettono la situazione reale.’

 

* La mia conversione della citazione in linea degli autori in collegamenti ipertestuali.

Pubblicato per la prima volta il 25 luglio 2022.

Scrittore su apprendimento automatico, specialista di dominio nella sintesi di immagini umane. Ex capo della ricerca contenuti presso Metaphysic.ai.