stomp AI biedt verbeterde tracking van eigendom van offshore-eigendom in het VK - Unite.AI
Verbind je met ons

Artificial Intelligence

AI biedt verbeterde tracking van eigendom van offshore-eigendom in het VK

mm
Bijgewerkt on

Nieuw onderzoek van twee Britse universiteiten heeft tot doel meer licht te werpen op de mogelijke staat van op onroerend goed gebaseerd witwassen van geld in het Verenigd Koninkrijk, en vooral in de zeer gewaardeerde Londense vastgoedmarkt.

Volgens de resultaten van het project bedraagt ​​het totale aantal 'onconventionele' woonhuizen (dwz eigendommen die niet voor lange termijn door eigenaren of huurders worden gebruikt) alleen al in Londen ongeveer 138,000.

Dit cijfer is 44% hoger dan de officiële cijfers, die worden geleverd en periodiek worden bijgewerkt door de Britse overheid.

De onderzoekers gebruikten verschillende Natural Language Processing (NLP)-technieken, samen met aanvullende gegevens en ondersteunend onderzoek, om de beperkte officiële informatie die de Britse overheid beschikbaar stelt over het percentage, de waarde, de locatie en het soort onroerend goed dat eigendom is van offshore-bedrijven in het Verenigd Koninkrijk, uit te breiden. , waarvan de meest lucratieve zich in de hoofdstad bevinden.

Uit het onderzoek bleek dat de totale hoeveelheid offshore, low-use en airbnb-achtige eigendommen (dwz 'informele bewoning') in het VK samen ergens tussen de £ 145-174 miljard GBP waard zijn, verdeeld over ongeveer 144,000-164,000 eigendommen.

Het ontdekte ook dat offshore-eigendommen van dit type doorgaans duurder zijn en kenmerkende patronen hebben met betrekking tot waar ze zich in het VK bevinden.

De onderzoekers schatten dat offshore eigendom is Onconventioneel binnenlands eigendom (UDP) vertegenwoordigt 7.5% van de totale binnenlandse waarde, en die £ 56 miljard van de geschatte waarde is beperkt tot slechts 42,000 woningen.

In de krant staat:

'Individuele offshore-eigendommen zijn erg duur, zelfs volgens de normen van UDP, bovendien zijn ze geconcentreerd in het centrum van Londen met een sterke ruimtelijke autocorrelatie.

'Daarentegen is genesteld offshore-vastgoed iets minder geconcentreerd in het centrum van Londen, maar sterker geconcentreerd in het algemeen, en er is ook bijna geen ruimtelijke correlatie.'

Analyse van de uitgebreide gegevens laat zien dat een groot aantal offshore-eigendommen eigendom is van entiteiten in de Afhankelijkheden van de menigte (CD), met het op een na grootste aantal voor rekening van de Britse overzeese gebiedsdelen (in de onderstaande grafiek betekent 'PWW2' landen die na de Tweede Wereldoorlog onafhankelijk werden van Groot-Brittannië).

Dispositie van onroerend goed in buitenlandse handen, volgens de resultaten van de nieuwe krant. Bron: https://arxiv.org/src/2207.10931v1/anc/Offshore_London_Supplementary_Material.pdf

Dispositie van onroerend goed in buitenlandse handen, volgens de resultaten van de nieuwe krant. Bron: https://arxiv.org/src/2207.10931v1/anc/Offshore_London_Supplementary_Material.pdf

De krant merkt op:

'In feite worden slechts 4 territoria, de Britse Maagdeneilanden, Jersey, Guernsey en het eiland Man, geassocieerd met 78% van alle eigendommen.'

De nieuwe verbeterde gegevens hebben het mogelijk gemaakt om sub-eigendommen te bepalen die bestaan ​​binnen een bekend onroerend goed in buitenlandse handen - een mogelijkheid die meestal wordt belemmerd door de platte en beperkte gegevens die in de officiële cijfers worden verstrekt.

De resultaten geven ook aan dat offshore-, Airbnb- en low-use-eigendommen aanzienlijk meer geografisch geconcentreerd zijn dan normale woningen, en bovendien geconcentreerd zijn in gebieden met een hogere waarde.

Heatmaps met betrekking tot verschillende soorten onroerend goed in buitenlands bezit in Londen. Bron: https://arxiv.org/pdf/2207.10931.pdf

Gevisualiseerde concentratiekaarten met betrekking tot verschillende soorten onroerend goed in buitenlands bezit in Londen. Bron: https://arxiv.org/pdf/2207.10931.pdf

Over de bovenstaande grafiek geven de auteurs commentaar:

'Offshore-huishoudelijk onroerend goed heeft een aantal extreem hoge concentraties waarbij een volledig woningbouwproject eigendom is van een offshore-bedrijf.'

De auteurs hebben vrijgegeven code voor hun verwerkingspijplijn.

De nieuw papier is getiteld Wat is er in de wasserette? In kaart brengen en karakteriseren van offshore onroerend goed in Londen, en is afkomstig van onderzoekers van The Bartlett Faculty of the Built Environment aan University College London en Kingston University's Department of Economics.

Het probleem aanpakken

De auteurs merken op dat na tientallen jaren van inspanningen om het gebruik van onroerend goed voor het witwassen van geld in het Verenigd Koninkrijk te beheersen, de los van een uitgelekte lijst van Britse eigendommen in offshorebezit door de Britse publicatie Prive Oog in 2015 om de Britse regering aan te sporen een regelmatig bijgewerkte lijst te publiceren van offshore-eigendommen in het grootste deel van het VK, bekend als Buitenlandse bedrijven die onroerend goed bezitten in Engeland en Wales (OCOD).

De onderzoekers merken op dat hoewel OCOD een stap voorwaarts is in het onderzoek en de analyse van overzees eigendom en mogelijk witwassen van geld in het VK, de gegevens een aantal beperkingen hebben, waarvan sommige cruciaal zijn:

'Deze adressen kunnen onvolledig zijn, geneste eigendommen bevatten, waar meerdere eigendommen binnen een enkele rij of titelnummer staan, het bevat ook geen informatie over of het onroerend goed particulier, zakelijk of iets anders is.

'Dergelijke gegevens van slechte kwaliteit maken het moeilijk om de distributie en kenmerken van offshore-eigendom in het VK te begrijpen.'

Het is bijzonder moeilijk om gegevens te verkrijgen over terloops verhuurde eigendommen, zoals Airbnb-eigendommen, aangezien openbaar beschikbare gegevens beperkt of niet bestaan. Bovendien maakt Schotland (een deel van het Verenigd Koninkrijk) zijn eigen register van de verkoop van onroerend goed niet openbaar, in tegenstelling tot Engeland en Wales.

Om enkele van de inconsistenties rond eigendomsclassificatie tegen te gaan, heeft de Britse regering het unieke eigendomsreferentienummer (UPRN) systeem, ontworpen om duidelijkere relaties mogelijk te maken tussen verschillende databronnen voor onroerend goed. De auteurs noteren echter * 'terwijl het gebruik van de UPRN verplicht is, maakt bijna geen enkele overheidsdienst er gebruik van, waardoor het koppelen van de gegevens geavanceerde gegevensverwerking vaardigheden'.

Het nieuwe onderzoek was dus bedoeld om de gegevens gedetailleerder en inzichtelijker te maken.

Verzamelen en verbinden van de gegevens

Binnen elk individueel land zijn adresformaten meestal voorspelbaar en consistent, ook van toepassing op adressen in het VK. Geconfronteerd met 'platte', op tekst gebaseerde geadresseerde gegevens (zoals die geleverd door OCOD), zijn er dus een aantal open source oplossingen voor adresparsing ontstaan ​​om adressen naar andere gegevensbronnen te verwijzen.

Veel van deze zijn echter getraind met behulp van Stratenplan openen gegevens, die adressen kunnen opleveren die in werkelijkheid tientallen of zelfs honderden geneste subadressen kunnen hosten (zoals appartementen op een breed adres voor een flatgebouw). Bijgevolg kan zelfs een veelgeprezen adres-parser zoals libpostaal heeft moeite gehad wanneer u probeert onvolledige adressen te ontleden.

Om de parser voor hun project te maken, gebruikten de onderzoekers van het nieuwe artikel een aantal openbaar beschikbare datasets. De kerngegevens werden aangeleverd door OCOD, terwijl het onderdeel gegevensopschoning gebruik maakte van de Kadasterprijs datasetSamen met de VOA-beoordelingen listing dataset, en de Office of National Statistics Postcode Directory (ONPD).

De Airbnb-gegevens zijn afkomstig van de BinnenAirbnb domein, dat alleen volledige verhuurde woningen omvat, dus exclusief de oorspronkelijk voorgestelde use-case voor Airbnb (dwz het incidenteel geheel of gedeeltelijk verhuren van de eigen woning).

De gegevensset van de auteurs over weinig gebruikte eigendommen werd aangevuld met informatie die was ontvangen van succesvolle Freedom of Information (FOI) -verzoeken, meestal verzameld voor een eerder project.

De basisgegevens van OCOD zijn een .CSV door komma's gescheiden bestand met een goede structuur en een voorspelbaar formaat.

De pijplijn bestond uit vijf fasen: labelen, parseren, uitbreiden, classificeren en samentrekken. In het begin zou elk individueel adres in het echte leven kunnen worden omgezet in meerdere geneste eigendommen, hoewel dit niet expliciet wordt vermeld in de door de overheid verstrekte gegevens.

De onderzoekers voerden wat lichte syntactische voorverwerking uit en importeerden vervolgens de gegevens naar programmatische, een platform dat is ontworpen om geannoteerde NLP-datasets te maken zonder handmatige labeling. Hier werden entiteiten gelabeld met behulp van reguliere expressies (Regex) om acht soorten benoemde entiteiten te beschrijven (zie onderstaande afbeelding):

Nadat deze labels waren toegevoegd, werd de dataset geëxtraheerd als een JSON-bestand, waarbij labeloverlappingen werden verwijderd door eenvoudige, op regels gebaseerde routines.

Bovendien werd de uitvoer van programmatic gebruikt om een ​​voorspellend model voor te trainen SpaCy, ondersteund door die van Facebook RoBERTa. Eenmaal ontdaan, creëerden de onderzoekers een vergelijkingsset van de grondwaarheid van 1000 willekeurig gelabelde waarnemingen. De nauwkeurigheidsscore van gegevens zonder toezicht zou uiteindelijk worden geëvalueerd aan de hand van deze grondwaarheid.

Adresparsing bracht een aantal uitdagingen met zich mee. De auteurs hebben aan elk teken een eigen rij toegewezen en aan elke labelklasse een eigen kolom, en vervolgens de kolommen teruggepropageerd om volledige adresrijen te genereren.

Aangezien sommige enkele adressen meerdere afzonderlijke woningen bevatten, was het noodzakelijk om de database uit te breiden door enkele adressen onder te verdelen in sub-eigenschappen die aanwezig zijn in complementaire databases.

Hierna heeft de adresclassificatiefase een kruisverwijzing gemaakt naar alle gelegen postcodes met behulp van de ONSPD-database. Dit verbindt de adresgegevens met volkstellingen en andere demografische gegevens, en identificeert ook subeigenschappen die voorheen verborgen waren achter de ondoorzichtige adressen van de OCOD-gegevens.

Ten slotte filterde het adrescontractieproces alle niet-huishoudelijke eigendommen (dwz commerciële panden) uit geneste eigendomsgroepen.

Analyse

Om de nauwkeurigheid van de verbeterde gegevens te testen, creëerden de auteurs, zoals eerder vermeld, een voorbeeld van een grondwaarheidsset die werd achtergehouden voor de algemene analyse en alleen werd gebruikt om de nauwkeurigheid van de voorspellingen en analyses te testen.

Handmatige controle op de grondwaarheid omvatte het gebruik van kaartsoftware, analyse van foto's van de eigendommen in de achtergehouden set en zoekopdrachten op internet om het type eigendom te evalueren. Daarna werden de prestaties van de gegevens gemeten aan de hand van precisie-, herinnerings- en F1-scores.

De waarde van onroerend goed voor weinig gebruik en huishoudelijk gebruik werd verkregen met een grafisch basismodel, dezelfde methode die ook werd gebruikt om UDP-eigenschappen af ​​te leiden.

De NER-taak, getest tegen de veeleisende, handmatig gelabelde grondwaarheid, behaalde een F1-score van 0.96 (bijna '100%', in termen van nauwkeurigheid).

F1-scores voor de NER-labeltaak. Er wordt enige oneffenheid gevonden, aangezien het proces het aantal woningen enigszins overschat en het totale aantal bedrijven onderschat vanwege de structuur van de verbeterde gegevens.

F1-scores voor de NER-labeltaak. Er wordt enige oneffenheid gevonden, aangezien het proces het aantal woningen enigszins overschat en het totale aantal bedrijven onderschat vanwege de structuur van de verbeterde gegevens.

Wat de UDP's in Londen betreft, tonen de definitieve resultaten een totaal van 138,000 inzendingen – 44% meer dan de 94,000 in de oorspronkelijke OCOD-dataset (dwz recente officiële cijfers).

De uitsplitsing naar type vastgoed onder classificatie type 2.

De uitsplitsing naar type vastgoed onder classificatie type 2.

De resultaten geven aan dat de totale waarde van de offshore-eigendommen ongeveer £ 56 miljard bedraagt, terwijl de totale waarde van onroerend goed voor weinig gebruik wordt geschat op £ 85 miljard.

De auteurs merken op:

'[Alle] UDP's zijn veel duurder dan de gemiddelde conventionele vastgoedprijs van £ 600 duizend.'

Dit soort verbeterde gegevens kan nodig zijn om het gebruik van vastgoedspeculatie als witwasactiviteit in het VK tegen te gaan. De auteurs wijzen op de groeiende hoeveelheid onderzoek en algemene literatuur die suggereert dat verbeterde gegevens kunnen helpen bij het bestrijden van AML-vastgoedspeculatie, en concluderen:

'Deze gegevens kunnen door sociologen, economen en beleidsmakers worden gebruikt om ervoor te zorgen dat pogingen om witwassen en hoge vastgoedprijzen terug te dringen, gebaseerd zijn op gedetailleerde gegevens die de werkelijke situatie weerspiegelen.'

 

* Mijn conversie van de inline citatie van de auteurs naar hyperlinks.

Voor het eerst gepubliceerd op 25 juli 2022.