Vernetzen Sie sich mit uns

Künstliche Intelligenz

KI bietet eine verbesserte Nachverfolgung von Offshore-Immobilienbesitz im Vereinigten Königreich

mm

Neue Forschungsergebnisse zweier britischer Universitäten sollen ein besseres Licht auf den potenziellen Stand der immobilienbasierten Geldwäsche im Vereinigten Königreich und insbesondere auf dem hochpreisigen Londoner Immobilienmarkt werfen.

Den Ergebnissen des Projekts zufolge beträgt die Gesamtzahl der „unkonventionellen“ Wohnimmobilien (also Immobilien, die nicht langfristig als Wohnraum von Eigentümern oder Mietern genutzt werden) allein in London rund 138,000.

Diese Zahl liegt 44 % über den offiziellen Zahlen, die von der britischen Regierung bereitgestellt und regelmäßig aktualisiert werden.

Die Forscher verwendeten verschiedene Techniken der Verarbeitung natürlicher Sprache (NLP) zusammen mit zusätzlichen Daten und bestätigender Forschung, um die begrenzten offiziellen Informationen zu erweitern, die die britische Regierung über den Prozentsatz, den Wert, den Standort und die Arten von Immobilien im Besitz von Offshore-Unternehmen im Vereinigten Königreich zur Verfügung stellt , die lukrativsten davon gibt es in der Hauptstadt.

Die Untersuchung ergab, dass der Gesamtwert der Offshore-Immobilien, der wenig genutzten Immobilien und der Airbnb-ähnlichen (d. h. „gelegentlich genutzten“) Immobilien in Großbritannien insgesamt zwischen 145 und 174 Milliarden GBP beträgt und sich auf etwa 144,000 bis 164,000 Immobilien beläuft.

Darüber hinaus wurde festgestellt, dass Offshore-Immobilien dieser Art in der Regel teurer sind und hinsichtlich ihres Standorts im Vereinigten Königreich charakteristische Muster aufweisen.

Die Forscher schätzen, dass es sich um Offshore-Anlagen handelt Unkonventionelles Wohneigentum (UDP) stellt 7.5 % des gesamten inländischen Wertes dar, und die 56 Milliarden Pfund des geschätzten Wertes sind auf nur 42,000 Wohnungen begrenzt.

Das Papier sagt:

„Einzelne Offshore-Immobilien sind selbst nach UDP-Standards sehr teuer, außerdem konzentrieren sie sich auf das Zentrum von London und weisen eine starke räumliche Autokorrelation auf.“

„Im Gegensatz dazu sind verschachtelte Offshore-Immobilien etwas weniger auf die Londoner Innenstadt konzentriert, aber insgesamt stärker konzentriert. Es besteht auch fast keine räumliche Korrelation.“

Die Analyse der erweiterten Daten zeigt, dass eine große Anzahl von Offshore-Liegenschaften Unternehmen in der Region gehören Crowd-Abhängigkeiten (CD), wobei die zweitgrößte Zahl auf die britischen Überseegebiete entfällt (in der folgenden Tabelle bezeichnet „PWW2“ Länder, die nach dem Zweiten Weltkrieg ihre Unabhängigkeit von Großbritannien erlangten).

Verfügung über ausländisches Eigentum, so die Ergebnisse des neuen Papiers. Quelle: https://arxiv.org/src/2207.10931v1/anc/Offshore_London_Supplementary_Material.pdf

Verfügung über ausländisches Eigentum, so die Ergebnisse des neuen Papiers. Quelle: https://arxiv.org/src/2207.10931v1/anc/Offshore_London_Supplementary_Material.pdf

Das Papier stellt fest:

„Tatsächlich sind 4 % aller Immobilien auf nur vier Gebiete zurückzuführen: die Britischen Jungferninseln, Jersey, Guernsey und die Isle of Man.“

Die neuen erweiterten Daten haben es ermöglicht, Untergrundstücke zu bestimmen, die innerhalb einer bekannten im Ausland befindlichen Immobilie vorhanden sind – eine Möglichkeit, die normalerweise durch die flachen und begrenzten Daten in den offiziellen Zahlen behindert wird.

Die Ergebnisse deuten auch darauf hin, dass Offshore-, Airbnb- und gering genutzte Immobilien deutlich stärker geografisch konzentriert sind als normale Eigenheime und darüber hinaus in höherwertigen Gebieten konzentriert sind.

Heatmaps zu verschiedenen Arten von Immobilien in ausländischem Besitz in London. Quelle: https://arxiv.org/pdf/2207.10931.pdf

Visualisierte Konzentrationskarten für verschiedene Arten von Immobilien in ausländischem Besitz in London. Quelle: https://arxiv.org/pdf/2207.10931.pdf

Zu der obigen Grafik kommentieren die Autoren:

„Im Offshore-Immobiliensektor gibt es einige extrem hohe Konzentrationen, bei denen eine ganze Wohnsiedlung im Besitz einer Offshore-Gesellschaft ist.“

Die Autoren haben freigegebener Code für ihre Verarbeitungspipeline.

Die neues Papier ist betitelt Was ist im Waschsalon? Kartierung und Charakterisierung von Offshore-Immobilien in Londonund stammt von Forschern der Bartlett Faculty of the Built Environment am University College London und der Wirtschaftsabteilung der Kingston University.

Das Problem ansprechen

Die Autoren stellen fest, dass nach jahrzehntelangen Bemühungen, die Nutzung von Immobilien für Geldwäschezwecke im Vereinigten Königreich zu kontrollieren, dies nicht der Fall war Release einer durchgesickerten Liste britischer Offshore-Immobilien durch die britische Veröffentlichung Privatdetektiv im Jahr 2015, um die britische Regierung dazu anzuregen, eine regelmäßig aktualisierte Liste von Offshore-Immobilien in den meisten Teilen des Vereinigten Königreichs zu veröffentlichen, bekannt als Ausländische Unternehmen, die Immobilien in England und Wales besitzen (OCOD).

Die Forscher stellen fest, dass OCOD zwar einen Fortschritt bei der Erforschung und Analyse ausländischer Eigentumsverhältnisse und potenzieller Geldwäsche im Vereinigten Königreich darstellt, die Daten jedoch eine Reihe von Einschränkungen aufweisen, von denen einige entscheidend sind:

„Diese Adressen können unvollständig sein, verschachtelte Immobilien enthalten, wenn mehrere Immobilien in einer einzelnen Zeile oder Titelnummer vorhanden sind, und sie enthalten auch keine Informationen darüber, ob es sich bei der Immobilie um eine Wohnimmobilie, eine Geschäftsimmobilie oder etwas anderes handelt.“

„Die Datenqualität ist so schlecht, dass es schwierig ist, die Verteilung und die Merkmale von Offshore-Immobilien in Großbritannien zu verstehen.“

Es ist besonders schwierig, Daten über gelegentlich vermietete Immobilien wie Airbnb-Immobilien zu erhalten, da öffentlich verfügbare Daten begrenzt oder nicht vorhanden sind. Darüber hinaus macht Schottland (ein Teil des Vereinigten Königreichs) im Gegensatz zu England und Wales sein eigenes Register der Immobilienverkäufe nicht öffentlich zugänglich.

Um einigen Inkonsistenzen bei der Immobilienklassifizierung entgegenzuwirken, hat die britische Regierung die Unique Property Reference Number eingeführt (UPRN)-System, das klarere Beziehungen zwischen verschiedenen Immobiliendatenquellen ermöglichen soll. Allerdings stellen die Autoren fest* „Während die Verwendung des UPRN vorgeschrieben ist, wird es von fast keiner Regierungsbehörde verwendet, was bedeutet, dass die Verknüpfung der Daten fortgeschritten sein muss.“ Datenverarbeitung Fähigkeiten'.

Ziel der neuen Forschung war es daher, die Daten detaillierter und aufschlussreicher zu gestalten.

Sammeln und Verbinden der Daten

Innerhalb eines Landes sind Adressformate in der Regel vorhersehbar und einheitlich, was auch für Adressen in Großbritannien gilt. Angesichts „flacher“, textbasierter Adressdaten (wie sie beispielsweise von OCOD bereitgestellt werden) sind daher zahlreiche Open-Source-Lösungen zur Adressanalyse entstanden, um Adressen mit anderen Datenquellen abzugleichen.

Viele davon werden jedoch mit trainiert Straßenkarte öffnen Daten, die Adressen ergeben können, die tatsächlich Dutzende oder sogar Hunderte verschachtelter Unteradressen enthalten können (z. B. Wohnungen in einer weitreichenden Adresse für einen Wohnblock). Folglich kann sogar ein renommierter Adressparser wie z libpostal hat hatte Schwierigkeiten beim Versuch, unvollständige Adressen zu analysieren.

Um den Parser für ihr Projekt zu erstellen, nutzten die Forscher der neuen Studie eine Reihe öffentlich zugänglicher Datensätze. Die Schlüsseldaten wurden von OCOD bereitgestellt, während die Datenbereinigungskomponente den Grundbuchpreis verwendete. DatensatzZusammen mit den VOA-Bewertungen Auflistungsdatensatz und das Office of National Statistics Postcode Directory (ONSPD).

Die Airbnb-Daten stammen von InsideAirbnb Domäne, die nur ganze Häuser umfasst, die vermietet werden, und somit den ursprünglich vorgeschlagenen Anwendungsfall für Airbnb ausschließt (d. h. die gelegentliche Vermietung des gesamten oder eines Teils des eigenen Hauses).

Der Datensatz der Autoren zu wenig genutzten Grundstücken wurde durch Informationen aus erfolgreichen Informationsfreiheitsanfragen (FOI) ergänzt, die größtenteils für eine früheres Projekt.

Die Basisdaten von OCOD sind eine durch Kommas getrennte .CSV-Datei mit einem guten Grad an Struktur und vorhersehbarem Format.

Die Pipeline bestand aus fünf Phasen: Etikettieren, Parsen, Erweitern, Klassifizieren und Kontrahieren. Zu Beginn könnte jede einzelne Adresse im wirklichen Leben in mehrere verschachtelte Eigenschaften aufgelöst werden, obwohl dies in den von der Regierung bereitgestellten Daten nicht explizit angegeben ist.

Die Forscher führten eine leichte syntaktische Vorverarbeitung durch und importierten die Daten dann in Programmatic, eine Plattform zur Erstellung annotierter NLP-Datensätze ohne manuelle Beschriftung. Hier wurden Entitäten mithilfe regulärer Ausdrücke (Regex) gekennzeichnet, um acht Arten benannter Entitäten zu beschreiben (siehe Abbildung unten):

Nachdem diese Beschriftungen hinzugefügt wurden, wurde der Datensatz als JSON-Datei extrahiert, wobei Beschriftungsüberschneidungen durch einfache regelbasierte Routinen entfernt wurden.

Darüber hinaus wurde die Ausgabe von Programmatic verwendet, um ein Vorhersagemodell für SpaCy, untermauert durch Facebooks Roberta. Nach der Entrauschung erstellten die Forscher einen Ground-Truth-Vergleichssatz aus 1000 zufällig markierten Beobachtungen. Der Genauigkeitswert unbeaufsichtigter Daten würde schließlich anhand dieser Grundwahrheit bewertet.

Das Parsen von Adressen brachte eine Reihe von Herausforderungen mit sich. Die Autoren haben jedem Zeichen eine eigene Zeile und jeder Beschriftungsklasse eine eigene Spalte zugewiesen und die Spalten dann rückwärts propagiert, um vollständige Adresszeilen zu generieren.

Da einige einzelne Adressen mehrere unterschiedliche Wohnungen enthielten, war es notwendig, die Datenbank zu erweitern, indem einzelne Adressen in Unterobjekte unterteilt wurden, die in ergänzenden Datenbanken vorhanden waren.

Anschließend wurden in der Adressklassifizierungsphase alle gefundenen Postleitzahlen mithilfe der ONSPD-Datenbank abgeglichen. Das Prozessdefinierung verbindet die Adressdaten mit Volkszählungs- und anderen demografischen Daten und identifiziert auch Untereigenschaften, die zuvor hinter den undurchsichtigen Adressen der OCOD-Daten verborgen waren.

Schließlich wurden durch den Adresskontraktionsprozess alle Nichtwohnimmobilien (z. B. Gewerbeimmobilien) aus verschachtelten Immobiliengruppen herausgefiltert.

Analyse

Um die Genauigkeit der erweiterten Daten zu testen, erstellten die Autoren, wie bereits erwähnt, einen Beispiel-Ground-Truth-Satz, der von der allgemeinen Analyse ferngehalten und nur zum Testen der Genauigkeit der Vorhersagen und Analysen verwendet wurde.

Die manuelle Überprüfung der Grundwahrheit umfasste den Einsatz von Kartensoftware sowie die Analyse von Bildern der im zurückgehaltenen Satz enthaltenen Immobilien und Internetsuchen zur Bewertung der Art der Immobilie. Anschließend wurde die Leistung der Daten anhand von Präzisions-, Erinnerungs- und F1-Scores gemessen.

Der Wert von gering genutzten und Wohnimmobilien wurde mit einem einfachen grafischen Modell ermittelt. Dieselbe Methode wurde auch zur Ableitung von UDP-Eigenschaften verwendet.

Die NER-Aufgabe, die mit der aufwändigen, manuell gekennzeichneten Grundwahrheit getestet wurde, erreichte einen F1-Score von 0.96 (nahezu „100 %“ in Bezug auf die Genauigkeit).

F1-Ergebnisse für die NER-Kennzeichnungsaufgabe. Es wird eine gewisse Ungleichmäßigkeit festgestellt, da der Prozess aufgrund der Struktur der erweiterten Daten die Anzahl inländischer Immobilien leicht überschätzt und die Gesamtzahl der Unternehmen unterschätzt.

F1-Ergebnisse für die NER-Kennzeichnungsaufgabe. Es wird eine gewisse Ungleichmäßigkeit festgestellt, da der Prozess aufgrund der Struktur der erweiterten Daten die Anzahl inländischer Immobilien leicht überschätzt und die Gesamtzahl der Unternehmen unterschätzt.

In Bezug auf UDPs in London zeigen die Endergebnisse insgesamt 138,000 Einträge – 44 % mehr als die 94,000 im ursprünglichen OCOD-Datensatz (d. h. aktuelle offizielle Zahlen).

Die Aufschlüsselung der Immobilientypen nach Typ-2-Klassifizierung.

Die Aufschlüsselung der Immobilientypen nach Typ-2-Klassifizierung.

Die Ergebnisse zeigen, dass der Gesamtwert der Offshore-Immobilien bei rund 56 Milliarden Pfund liegt, während der Gesamtwert der gering genutzten Immobilien auf 85 Milliarden Pfund geschätzt wird.

Die Autoren bemerken:

„[Alle] UDPs sind viel teurer als der durchschnittliche konventionelle Immobilienpreis von 600 £.“

Diese Art verbesserter Daten kann notwendig sein, um den Einsatz von Immobilienspekulation als Geldwäscheaktivität im Vereinigten Königreich zu bekämpfen. Die Autoren weisen auf die wachsende Zahl an Forschungsergebnissen und allgemeiner Literatur hin, die darauf hindeuten, dass verbesserte Daten bei der Bekämpfung von Immobilienspekulationen gegen Geldwäsche helfen könnten, und kommen zu dem Schluss:

„Diese Daten können von Soziologen, Ökonomen und politischen Entscheidungsträgern genutzt werden, um sicherzustellen, dass die Versuche, Geldwäsche und hohe Immobilienpreise einzudämmen, auf detaillierten Daten basieren, die die tatsächliche Situation widerspiegeln.“

 

* Meine Konvertierung der Inline-Zitate der Autoren in Hyperlinks.

Erstveröffentlichung am 25. Juli 2022.

Autor zum Thema maschinelles Lernen, Fachspezialist für die Synthese menschlicher Bilder. Ehemaliger Leiter für Forschungsinhalte bei Metaphysic.ai.
Persönliche Seite: martinanderson.ai
Kontakt: [E-Mail geschützt]
Twitter: @manders_ai