Seguici sui social

AI offre un monitoraggio migliorato della proprietà di proprietà offshore nel Regno Unito

Intelligenza Artificiale

AI offre un monitoraggio migliorato della proprietà di proprietà offshore nel Regno Unito

mm

Una nuova ricerca di due università del Regno Unito mira a gettare maggiore luce sul potenziale stato del riciclaggio di denaro basato sulla proprietà nel Regno Unito, e in particolare nel mercato immobiliare londinese.

Secondo i risultati del progetto, il numero totale di immobili residenziali "non convenzionali" (vale a dire immobili che non vengono utilizzati a lungo termine come abitazioni dai proprietari o dagli affittuari) ammonta a circa 138,000 nella sola Londra.

Questa cifra è superiore del 44% rispetto alle cifre ufficiali, fornite e periodicamente aggiornate dal governo del Regno Unito.

I ricercatori hanno utilizzato varie tecniche di elaborazione del linguaggio naturale (NLP), insieme a dati aggiuntivi e ricerche corroboranti, per estendere le limitate informazioni ufficiali che il governo britannico rende disponibili sulla percentuale, il valore, l’ubicazione e i tipi di proprietà possedute dalle società offshore nel Regno Unito. , i più redditizi dei quali si trovano nella capitale.

La ricerca ha scoperto che il valore complessivo delle proprietà offshore, a basso utilizzo e in stile Airbnb (ovvero "occupazione occasionale") nel Regno Unito ammonta complessivamente a una cifra compresa tra 145 e 174 miliardi di sterline, suddivise in circa 144,000-164,000 proprietà.

È stato inoltre scoperto che le proprietà offshore di questo tipo sono solitamente più costose e presentano caratteristiche distintive in base alla loro ubicazione nel Regno Unito.

I ricercatori stimano che sia di proprietà offshore Proprietà domestica non convenzionale (UDP) rappresenta il 7.5% del valore interno totale e quei 56 miliardi di sterline del valore stimato sono limitati a sole 42,000 abitazioni.

Il documento afferma:

'Le singole proprietà offshore sono molto costose anche per gli standard di UDP, inoltre sono concentrate nel centro di Londra con una forte correlazione automatica spaziale.

'Al contrario, le proprietà offshore nidificate sono un po' meno concentrate nel centro di Londra, ma in generale sono più concentrate, e non c'è quasi nessuna correlazione spaziale.'

L'analisi dei dati aumentati mostra che un gran numero di proprietà offshore appartengono a entità nel Dipendenze dalla folla (CD), con il secondo numero più grande rappresentato dai Territori britannici d'oltremare (nel grafico sottostante, "PWW2" indica i paesi che ottennero l'indipendenza dalla Gran Bretagna dopo la seconda guerra mondiale).

Disposizione di proprietà di proprietà straniera, secondo i risultati del nuovo documento. Fonte: https://arxiv.org/src/2207.10931v1/anc/Offshore_London_Supplementary_Material.pdf

Disposizione di proprietà di proprietà straniera, secondo i risultati del nuovo documento. Fonte: https://arxiv.org/src/2207.10931v1/anc/Offshore_London_Supplementary_Material.pdf

Il giornale osserva:

'In realtà solo 4 territori, Isole Vergini Britanniche, Jersey, Guernsey e Isola di Man, sono associati al 78% di tutte le proprietà.'

I nuovi dati migliorati hanno permesso di determinare le sottoproprietà che esistono all'interno di una nota proprietà di proprietà all'estero, una capacità solitamente ostacolata dai dati piatti e limitati forniti nelle cifre ufficiali.

I risultati indicano anche che le proprietà offshore, Airbnb e a basso utilizzo sono notevolmente più concentrate geograficamente rispetto alle normali case e sono inoltre concentrate in aree di maggior valore.

Mappe termiche relative a vari tipi di immobili di proprietà straniera a Londra. Fonte: https://arxiv.org/pdf/2207.10931.pdf

Mappe di concentrazione visualizzate relative a vari tipi di proprietà di proprietà all'estero a Londra. Fonte: https://arxiv.org/pdf/2207.10931.pdf

Del grafico sopra, gli autori commentano:

'Tra le proprietà immobiliari offshore si registrano concentrazioni estremamente elevate, in cui un intero complesso residenziale è di proprietà di una società offshore.'

Gli autori hanno codice rilasciato per la loro pipeline di elaborazione.

. nuovo documento è intitolato Cosa c'è nella lavanderia a gettoni? Mappatura e caratterizzazione degli immobili residenziali offshore a Londrae proviene dai ricercatori della Bartlett Faculty of the Built Environment presso l'University College di Londra e del Dipartimento di Economia della Kingston University.

Affrontare il problema

Gli autori osservano che dopo decenni di sforzi per controllare l'uso di beni immobili a scopo di riciclaggio di denaro nel Regno Unito, ci sono voluti i rilasciare di un elenco trapelato di proprietà britanniche di proprietà offshore dalla pubblicazione britannica Investigatore privato nel 2015 per spronare il governo del Regno Unito a pubblicare un elenco regolarmente aggiornato di proprietà di proprietà offshore nella maggior parte del Regno Unito, noto come Società estere che possiedono proprietà in Inghilterra e Galles (COD.COD).

I ricercatori osservano che sebbene OCOD sia un passo avanti nella ricerca e nell'analisi della proprietà all'estero e del potenziale riciclaggio di denaro nel Regno Unito, i dati presentano una serie di limiti, alcuni dei quali cruciali:

'Questi indirizzi possono essere incompleti, contenere proprietà nidificate, dove esistono più proprietà all'interno di una singola riga o numero di titolo, inoltre non contengono informazioni sul fatto che la proprietà sia domestica, aziendale o qualcos'altro.

"Dati di qualità così scadente rendono difficile comprendere la distribuzione e le caratteristiche delle proprietà offshore nel Regno Unito".

È particolarmente difficile ottenere dati sulle proprietà affittate casualmente come le proprietà di Airbnb, poiché i dati pubblicamente disponibili sono limitati o inesistenti. Inoltre, la Scozia (una parte del Regno Unito) non rende pubblico il proprio registro delle vendite immobiliari, a differenza dell'Inghilterra e del Galles.

Per contrastare alcune delle incongruenze relative alla classificazione delle proprietà, il governo del Regno Unito ha introdotto il numero di riferimento della proprietà univoco (UPRN), progettato per consentire relazioni più chiare tra diverse fonti di dati immobiliari. Tuttavia, gli autori notano* "sebbene l'uso dell'UPRN sia obbligatorio, quasi nessun dipartimento governativo lo utilizza, il che significa che il collegamento dei dati richiede elaborazione dati abilità'.

Così la nuova ricerca ha deciso di rendere i dati più granulari e perspicaci.

Raccolta e connessione dei dati

All'interno di ogni singolo Paese, i formati degli indirizzi sono solitamente prevedibili e coerenti, applicabili anche agli indirizzi del Regno Unito. Pertanto, di fronte a dati di indirizzi "piatti" basati su testo (come quelli forniti da OCOD), sono emerse diverse soluzioni open source di analisi degli indirizzi per incrociare gli indirizzi con altre fonti di dati.

Tuttavia, molti di questi vengono addestrati utilizzando Apri Mappa stradale dati, che possono produrre indirizzi che possono effettivamente ospitare decine o addirittura centinaia di sottoindirizzi nidificati (come appartamenti in un indirizzo ad ampio raggio per un condominio). Di conseguenza, anche un acclamato analizzatore di indirizzi come libpostal ha avuto difficoltà quando si tenta di analizzare indirizzi incompleti.

Per creare il parser per il loro progetto, i ricercatori del nuovo articolo hanno utilizzato diversi set di dati disponibili al pubblico. I dati chiave sono stati forniti da OCOD, mentre il componente di pulizia dei dati ha utilizzato il Land Registry Price. dataset, Insieme con l' Valutazioni VOA elencando il set di dati e l'elenco dei codici postali dell'Office of National Statistics (ONSPD).

I dati di Airbnb provengono dal All'interno di Airbnb dominio, che include solo intere case affittate, escludendo quindi il caso d'uso originariamente proposto per Airbnb (ovvero l'affitto occasionale di tutta o parte della propria casa).

Il set di dati sulle proprietà a basso utilizzo degli autori è stato ampliato con le informazioni ricevute dalle richieste di accesso alle informazioni (FOI) andate a buon fine, raccolte principalmente per un progetto precedente.

I dati di base di OCOD sono un file .CSV delimitato da virgole con un buon grado di struttura e un formato prevedibile.

La pipeline consisteva in cinque fasi: etichettatura, analisi, espansione, classificazione e contrazione. All'inizio, qualsiasi singolo indirizzo potrebbe risolversi nella vita reale in più proprietà nidificate, sebbene ciò non sia esplicito nei dati forniti dal governo.

I ricercatori hanno eseguito una leggera preelaborazione sintattica, quindi hanno importato i dati in programmatica, una piattaforma progettata per creare set di dati NLP con annotazioni senza etichettatura manuale. Qui, le entità sono state etichettate utilizzando espressioni regolari (Regex) per descrivere otto tipi di entità denominate (vedi immagine sotto):

Con queste etichette aggiunte, il set di dati è stato estratto come file JSON, con le sovrapposizioni di etichette rimosse da semplici routine basate su regole.

Inoltre, l'output programmatico è stato utilizzato per addestrare un modello predittivo per Spacy, sostenuto da Facebook RoBERta. Una volta denotato, i ricercatori hanno creato un set di confronto della verità fondamentale di 1000 osservazioni etichettate in modo casuale. Il punteggio di accuratezza dei dati non supervisionati verrebbe infine valutato rispetto a questa verità fondamentale.

L'analisi degli indirizzi ha presentato una serie di sfide. Gli autori hanno assegnato a ogni intervallo di caratteri la propria riga e a ogni classe di etichetta la propria colonna, quindi hanno propagato all'indietro le colonne per generare righe di indirizzi complete.

Poiché alcuni singoli indirizzi presentavano più abitazioni distinte, è stato necessario ampliare la banca dati, suddividendo i singoli indirizzi in sottoproprietà presenti in banche dati complementari.

Successivamente, la fase di classificazione degli indirizzi ha incrociato tutti i codici postali individuati utilizzando il database ONSPD. Questo processi collega i dati degli indirizzi al censimento e ad altri dati demografici e individua anche le sottoproprietà che erano state precedentemente nascoste dietro gli indirizzi opachi dei dati OCOD.

Infine, il processo di contrazione degli indirizzi ha filtrato tutte le proprietà non domestiche (ad esempio locali commerciali) dai gruppi di proprietà nidificati.

Analisi

Per testare l'accuratezza dei dati migliorati, gli autori, come accennato in precedenza, hanno creato un set di verità di base campione che è stato trattenuto dal ciclo generale di analisi e utilizzato solo per testare l'accuratezza delle previsioni e delle analisi.

Il controllo manuale della verità del terreno includeva l'uso di software cartografico, nonché l'analisi delle immagini delle proprietà presenti nel set trattenuto e delle ricerche su Internet per valutare il tipo di proprietà. Successivamente, le prestazioni dei dati sono state misurate rispetto ai punteggi di precisione, richiamo e F1.

Il valore degli immobili a basso utilizzo e domestici è stato ottenuto con un modello grafico di base, lo stesso metodo utilizzato anche per inferire le proprietà UDP.

Il compito NER, testato rispetto alla verità di base etichettata manualmente e ad alto impegno, ha ottenuto un punteggio F1 di 0.96 (vicino al '100%' in termini di accuratezza).

Punteggi F1 per l'attività di etichettatura NER. Si rilevano alcune disomogeneità, poiché il processo sovrastima leggermente il numero di immobili domestici e sottostima il numero totale di imprese, a causa della struttura dei dati migliorati.

Punteggi F1 per l'attività di etichettatura NER. Si rilevano alcune disomogeneità, poiché il processo sovrastima leggermente il numero di immobili domestici e sottostima il numero totale di imprese, a causa della struttura dei dati migliorati.

Per quanto riguarda gli UDP a Londra, i risultati finali mostrano un totale di 138,000 voci, il 44% in più rispetto alle 94,000 presenti nel set di dati OCOD originale (vale a dire, dati ufficiali recenti).

La suddivisione dei tipi di proprietà nella classificazione di tipo 2.

La suddivisione dei tipi di proprietà nella classificazione di tipo 2.

I risultati indicano che il valore totale delle proprietà offshore è di circa 56 miliardi di sterline, mentre il valore totale delle proprietà a basso utilizzo è stimato a 85 miliardi di sterline.

Gli autori notano:

"[Tutti] gli UDP sono molto più costosi del prezzo medio di un immobile convenzionale di 600 sterline".

Questo tipo di dati migliorati potrebbe essere necessario per combattere l'uso della speculazione immobiliare come attività di riciclaggio di denaro nel Regno Unito. Gli autori notano il crescente corpo di ricerca e letteratura generale che suggerisce che dati migliorati possono aiutare a combattere la speculazione sulla proprietà AML e concludono:

"Questi dati possono essere utilizzati da sociologi, economisti e decisori politici per garantire che i tentativi di ridurre il riciclaggio di denaro e gli elevati prezzi degli immobili siano basati su dati dettagliati che riflettano la situazione reale".

 

* La mia conversione delle citazioni in linea degli autori in collegamenti ipertestuali.

Pubblicato per la prima volta l'25 luglio 2022.

Scrittore di machine learning, specialista di dominio nella sintesi di immagini umane. Ex responsabile dei contenuti di ricerca presso Metaphysic.ai.
Sito personale: martinandson.ai
Contatti: [email protected]
Twitter: @manders_ai