stub AI pakub Ühendkuningriigis offshore-kinnisvara omandi paremat jälgimist – Unite.AI
Ühenda meile

Tehisintellekt

AI pakub Ühendkuningriigis offshore-kinnisvara omandi paremat jälgimist

mm
Ajakohastatud on

Kahe Ühendkuningriigi ülikooli uute uuringute eesmärk on heita suuremat valgust kinnisvarapõhise rahapesu võimalikule olukorrale Ühendkuningriigis ja eriti kõrgelt hinnatud Londoni kinnisvaraturul.

Projekti tulemuste kohaselt on ainuüksi Londonis nn ebatraditsiooniliste kodukinnisvarade (st kinnisvara, mida omanikud või üürnikud ei kasuta pikaajaliselt eluruumidena) koguarv ligikaudu 138,000 XNUMX-ni.

See arv on 44% kõrgem kui ametlikud andmed, mida Ühendkuningriigi valitsus esitab ja perioodiliselt ajakohastab.

Teadlased kasutasid erinevaid loomuliku keele töötlemise (NLP) tehnikaid koos täiendavate andmete ja kinnitavate uuringutega, et laiendada piiratud ametlikku teavet, mille Ühendkuningriigi valitsus teeb kättesaadavaks Ühendkuningriigi offshore-ettevõtetele kuuluva kinnisvara protsendi, väärtuse, asukoha ja tüüpide kohta. , millest tulutoovamad on pealinnas.

Uuring näitas, et Ühendkuningriigi offshore-, vähese kasutusega ja airbnb-tüüpi (st juhusliku kasutusega) kinnisvara koguväärtus on ligikaudu 145 174-144,000 164,000 kinnisvara kohta XNUMX–XNUMX miljardit naela.

Samuti leiti, et seda tüüpi offshore-kinnisvarad on tavaliselt kallimad ja neil on Ühendkuningriigis nende asukoha järgi tunnusmustrid.

Teadlaste hinnangul on see offshore-omanduses Ebatavaline kodukinnisvara (UDP) moodustab 7.5% kodumaisest koguväärtusest ja hinnanguliselt 56 miljardit naela piirdub vaid 42,000 XNUMX eluruumiga.

Dokumendis öeldakse:

„Individuaalsed offshore-kinnisvarad on isegi UDP standardite järgi väga kallid, lisaks on need koondunud Londoni kesklinna tugeva ruumilise autokorrelatsiooniga.

"Seevastu pesastatud offshore-kinnisvara on mõnevõrra vähem koondunud Londoni kesklinna, kuid üldiselt kontsentreeritud rohkem, ruumiline korrelatsioon peaaegu puudub."

Täiendatud andmete analüüs näitab, et suur hulk offshore-kinnistuid kuulub üksustele Rahvahulga sõltuvused (CD), mille arv on suuruselt teine ​​Briti ülemereterritooriumidel (alloleval graafikul tähistab "PWW2" riike, mis saavutasid pärast Teist maailmasõda Suurbritanniast iseseisvuse).

Välisomandis oleva vara käsutamine, vastavalt uue paberi tulemustele. Allikas: https://arxiv.org/src/2207.10931v1/anc/Offshore_London_Supplementary_Material.pdf

Välisomandis oleva vara käsutamine, vastavalt uue paberi tulemustele. Allikas: https://arxiv.org/src/2207.10931v1/anc/Offshore_London_Supplementary_Material.pdf

Leht märgib:

"Tegelikult on ainult 4 territooriumi Briti Neitsisaared, Jersey, Guernsey ja Mani saar seotud 78% kõigist kinnistutest."

Uued täiustatud andmed on võimaldanud kindlaks teha alamkinnistuid, mis eksisteerivad teadaolevas välisomandis olevas kinnisvaras – seda võimalust takistavad tavaliselt ametlikes arvudes esitatud lamedad ja piiratud andmed.

Tulemused näitavad ka, et offshore-, Airbnb- ja vähese kasutusega kinnisvarad on geograafiliselt märkimisväärselt kontsentreeritumad kui tavalised kodud ning lisaks on need koondunud kõrgema väärtusega piirkondadesse.

Soojuskaardid, mis on seotud erinevat tüüpi ülemere omanduses oleva kinnisvaraga Londonis. Allikas: https://arxiv.org/pdf/2207.10931.pdf

Visualiseeritud kontsentratsioonikaardid, mis on seotud erinevat tüüpi ülemere omanduses oleva kinnisvaraga Londonis. Allikas: https://arxiv.org/pdf/2207.10931.pdf

Ülaltoodud graafiku autorid kommenteerivad järgmist:

"Offshore kodukinnisvara kontsentratsioon on äärmiselt kõrge, kui kogu elamuarendus kuulub offshore-ettevõttele."

Autoritel on välja antud kood nende töötlemistorustiku jaoks.

. uus paber on pealkirjaga Mis on pesumajas? Offshore-omandis oleva kodukinnisvara kaardistamine ja iseloomustamine Londonisja pärineb Londoni ülikooli kolledži Bartletti ehituskeskkonna teaduskonna ja Kingstoni ülikooli majandusosakonna teadlastelt.

Probleemi käsitlemine

Autorid märgivad, et pärast aastakümneid kestnud jõupingutusi, et kontrollida kinnisvara kasutamist rahapesu eesmärgil Ühendkuningriigis, kulus vabastama Briti väljaande lekkinud nimekirjast Ühendkuningriigi offshore-omandis olevast kinnisvarast Private Eye 2015. aastal, et innustada Ühendkuningriigi valitsust avaldama korrapäraselt ajakohastatud nimekirja enamikus Ühendkuningriigis asuvatest offshore-omandis olevatest kinnisvaraobjektidest. Ülemere ettevõtted, millel on kinnisvara Inglismaal ja Walesis (OCOD).

Teadlased märgivad, et kuigi OCOD on samm edasi Ühendkuningriigi välisomandi ja võimaliku rahapesu uurimisel ja analüüsimisel, on andmetel mitmeid piiranguid, millest mõned on otsustava tähtsusega:

"Need aadressid võivad olla mittetäielikud, sisaldada pesastatud atribuute, kui ühe rea või pealkirjanumbri sees on mitu atribuuti, ei sisalda see ka teavet selle kohta, kas kinnisvara on kodune, äriline või midagi muud.

"Nii halva kvaliteediga andmed muudavad Ühendkuningriigis offshore-omandi jaotuse ja omaduste mõistmise keeruliseks."

Eriti keeruline on hankida andmeid juhuslikult renditud kinnisvara kohta, näiteks Airbnb kinnisvara kohta, kuna avalikult kättesaadavad andmed on piiratud või puuduvad. Lisaks ei tee Šotimaa (Ühendkuningriigi osa) erinevalt Inglismaast ja Walesist oma kinnisvara müügiregistrit avalikult kättesaadavaks.

Kinnisvara klassifitseerimisega seotud ebakõlade kõrvaldamiseks võttis Ühendkuningriigi valitsus kasutusele ainulaadse kinnisvara viitenumbri (UPRN) süsteem, mis on loodud selgemate suhete võimaldamiseks erinevate kinnisvaraandmete allikate vahel. Siiski märgivad autorid* Kuigi UPRN-i kasutamine on kohustuslik, ei kasuta seda peaaegu ükski valitsusasutus, mis tähendab, et andmete linkimine nõuab täpsemat andmetöötlus oskused".

Seega on uue uurimistöö eesmärk muuta andmed üksikasjalikumaks ja arusaadavamaks.

Andmete kogumine ja ühendamine

Igas riigis on aadressivormingud tavaliselt etteaimatavad ja järjepidevad, kohaldatavad ka Ühendkuningriigi aadresside puhul. Seega, seistes silmitsi nn lamedate tekstipõhiste adresseeritud andmetega (nagu OCOD-i pakutav), on ilmunud mitmeid avatud lähtekoodiga aadresside sõelumise lahendusi aadresside ristviitamiseks teistele andmeallikatele.

Kuid paljud neist on koolitatud kasutama Ava tänavakaart andmed, mis võivad anda aadresse, mis võivad tegelikult majutada kümneid või isegi sadu pesastatud alam-aadresse (nt kortermaja laiaulatusliku aadressiga korterid). Järelikult isegi paljukiidetud aadressiparser nagu libpostal on oli raskusi kui proovite sõeluda mittetäielikke aadresse.

Oma projekti jaoks parseri loomiseks kasutasid uue dokumendi teadlased mitmeid avalikult kättesaadavaid andmekogumeid. Põhiandmed esitas OCOD, andmete puhastamise komponent aga kasutas kinnistusraamatu hinda andmestikKoos VOA hinnangud loendi andmestik ja riikliku statistikaameti sihtnumbrite kataloog (ONSPD).

Airbnb andmed pärinesid InsideAirbnb domeen, mis hõlmab ainult terveid üürile antud kodusid, välistades seega Airbnb esialgse kavandatud kasutusviisi (st oma kodu või selle osa aeg-ajalt väljaüürimine).

Autorite vähekasutatud varade andmestikku täiendati teabega, mis saadi edukate teabevabaduse (FOI) taotluste kaudu, mis koguti enamasti varasem projekt.

OCOD-i baasandmeteks on hea struktuuri ja prognoositava vorminguga komadega eraldatud CSV-fail.

Torujuhe koosnes viiest etapist: märgistamine, sõelumine, laiendamine, klassifitseerimine ja lepingute sõlmimine. Alguses võis iga üksikaadress reaalses elus muutuda mitmeks pesastatud atribuudiks, kuigi see ei ole valitsuse edastatud andmetes selgesõnaline.

Teadlased viisid läbi kerge süntaktilise eeltöötluse ja importisid seejärel andmed programmiline, platvorm, mis on loodud märkustega NLP-andmestike loomiseks ilma käsitsi märgistamiseta. Siin märgistati olemid regulaaravaldiste (Regex) abil, et kirjeldada kaheksat tüüpi nimega olemi (vt pilti allpool):

Nende siltide lisamisega ekstraheeriti andmestik JSON-failina, siltide kattumised eemaldati lihtsate reeglipõhiste rutiinide abil.

Lisaks kasutati programmilise väljundit ennustava mudeli koolitamiseks SpaCy, mida toetab Facebook RoBERTa. Pärast müra kaotamist koostasid teadlased 1000 juhuslikult märgistatud vaatluse põhitõe võrdluskomplekti. Järelevalveta andmete täpsusskoori hinnatakse lõpuks selle põhitõe alusel.

Aadressi sõelumine esitas mitmeid väljakutseid. Autorid määrasid igale märgivahemikule oma rea ​​ja igale sildiklassile oma veeru ning seejärel levitasid veerud tagasi, et luua täielikud aadressiridad.

Kuna mõnel üksikul aadressil oli mitu erinevat eluruumi, oli vaja andmebaasi laiendada, jagades ainsa aadressid täiendavates andmebaasides olevateks alamkinnisvaradeks.

Pärast seda viitas aadresside klassifitseerimise etapp kõigile paiknevatele sihtnumbritele, kasutades ONSPD andmebaasi. See protsess ühendab aadressiandmed loenduse ja muude demograafiliste andmetega ning individualiseerib ka alamomadused, mis olid varem peidetud OCOD-andmete läbipaistmatute aadresside taha.

Lõpuks filtreeris aadressi kokkutõmbamise protsess pesastatud kinnisvararühmadest välja kõik mittekodused kinnisvarad (st äripinnad).

analüüs

Täiustatud andmete täpsuse testimiseks lõid autorid, nagu varem mainitud, proovipõhitõekomplekti, mida hoiti üldisest analüüsist eemal ja mida kasutati ainult ennustuste ja analüüside täpsuse testimiseks.

Põhitõe käsitsi kontrollimine hõlmas kaarditarkvara kasutamist, samuti hoitud komplektis olevate omaduste piltide analüüsi ja Interneti-otsinguid kinnisvara tüübi hindamiseks. Seejärel mõõdeti andmete toimivust täpsuse, meeldetuletuse ja F1 skooride alusel.

Vähekasutatud ja kodumaise vara väärtus saadi graafilise põhimudeliga, sama meetodit kasutati ka UDP omaduste järeldamiseks.

NER-i ülesanne, mida testiti suure pingutuse ja käsitsi märgistatud põhitõe vastu, sai F1-skooriks 0.96 (täpsuse osas 100% lähedal).

F1 hinded NER-i märgistamise ülesande eest. Leitakse mõningaid ebatasasusi, kuna protsess hindab täiustatud andmete struktuuri tõttu veidi üle kodumaiste kinnistute arvu ja alahindab ettevõtete koguarvu.

F1 hinded NER-i märgistamise ülesande eest. Leitakse mõningaid ebatasasusi, kuna protsess hindab täiustatud andmete struktuuri tõttu veidi üle kodumaiste kinnistute arvu ja alahindab ettevõtete koguarvu.

Seoses Londoni UDP-dega näitavad lõpptulemused kokku 138,000 44 kirjet – 94,000% rohkem kui XNUMX XNUMX, mis esines algses OCOD-i andmestikus (st hiljutised ametlikud arvud).

Kinnisvaratüüpide jaotus tüübi 2 klassifikatsiooni alusel.

Kinnisvaratüüpide jaotus tüübi 2 klassifikatsiooni alusel.

Tulemused näitavad, et offshore-kinnisvara koguväärtus on umbes 56 miljardit naela, samas kui vähekasutatud kinnisvara koguväärtus on hinnanguliselt 85 miljardit naela.

Autorid märgivad:

"[Kõik] UDP-d on palju kallimad kui keskmine tavahind 600 tuhat naela."

Sellised täiustatud andmed võivad olla vajalikud, et võidelda kinnisvaraga spekuleerimise kasutamisega Ühendkuningriigis rahapesuna. Autorid märgivad kasvavat uurimistöö ja üldise kirjanduse hulka, mis viitavad sellele, et paremad andmed võivad aidata võidelda AML-i kinnisvaraga seotud spekulatsioonidega, ja järeldavad:

"Neid andmeid saavad kasutada sotsioloogid, majandusteadlased ja poliitikakujundajad tagamaks, et katsed vähendada rahapesu ja kõrgeid kinnisvarahindu põhinevad üksikasjalikel andmetel, mis kajastavad tegelikku olukorda."

 

* Teisendan autorite tekstisisese tsitaadi hüperlinkideks.

Esmakordselt avaldatud 25. juulil 2022.