Kontakt z nami

Sztuczna inteligencja oferuje ulepszone śledzenie własności nieruchomości offshore w Wielkiej Brytanii

Artificial Intelligence

Sztuczna inteligencja oferuje ulepszone śledzenie własności nieruchomości offshore w Wielkiej Brytanii

mm

Nowe badanie przeprowadzone na dwóch brytyjskich uniwersytetach ma na celu rzucić więcej światła na potencjalny stan prania pieniędzy związanych z nieruchomościami w Wielkiej Brytanii, a zwłaszcza na wysoko cenionym londyńskim rynku nieruchomości.

Zgodnie z wynikami projektu, całkowita liczba „niekonwencjonalnych” nieruchomości mieszkalnych (tj. nieruchomości, które nie są długoterminowo użytkowane jako mieszkania przez właścicieli lub najemców) wynosi około 138,000 XNUMX w samym Londynie.

Liczba ta jest o 44% wyższa niż oficjalne dane podawane i okresowo aktualizowane przez rząd Wielkiej Brytanii.

Naukowcy wykorzystali różne techniki przetwarzania języka naturalnego (NLP), wraz z dodatkowymi danymi i badaniami potwierdzającymi, aby poszerzyć ograniczone oficjalne informacje udostępniane przez rząd Wielkiej Brytanii na temat odsetka, wartości, lokalizacji i rodzajów nieruchomości będących w posiadaniu spółek offshore w Wielkiej Brytanii , z których najbardziej dochodowe znajdują się w stolicy.

Badanie wykazało, że łączna wartość nieruchomości zagranicznych w Wielkiej Brytanii, nieruchomości rzadko użytkowanych i nieruchomości w stylu Airbnb (czyli przeznaczonych do „okazjonalnego zajmowania”) jest łączna i wynosi od 145 do 174 miliardów funtów brytyjskich i obejmuje około 144,000 164,000–XNUMX XNUMX nieruchomości.

Stwierdzono również, że nieruchomości offshore tego typu są zazwyczaj droższe i mają charakterystyczne wzorce w zależności od miejsca, w którym znajdują się w Wielkiej Brytanii.

Naukowcy szacują, że jest to własność offshore Niekonwencjonalna nieruchomość domowa (UDP) stanowi 7.5% całkowitej wartości krajowej, a szacowana wartość 56 miliardów funtów ogranicza się do zaledwie 42,000 XNUMX mieszkań.

Artykuł stwierdza:

„Pojedyncze nieruchomości offshore są bardzo drogie nawet jak na standardy UDP, w dodatku są skoncentrowane w centrum Londynu z silną autokorelacją przestrzenną.

„W przeciwieństwie do tego nieruchomości zlokalizowane poza granicami kraju są nieco mniej skoncentrowane w centrum Londynu, ale ogólnie bardziej skoncentrowane; nie ma też prawie żadnej korelacji przestrzennej”.

Analiza rozszerzonych danych pokazuje, że duża liczba nieruchomości offshore należy do podmiotów z branży Zależności tłumu (CD), przy czym drugą co do wielkości liczbą terytoriów zajmują brytyjskie terytoria zamorskie (na poniższym wykresie „PWW2” oznacza kraje, które uzyskały niepodległość od Wielkiej Brytanii po II wojnie światowej).

Jak wynika z nowego artykułu, rozdysponowanie majątkiem będącym własnością zagraniczną. Źródło: https://arxiv.org/src/2207.10931v1/anc/Offshore_London_Supplementary_Material.pdf

Jak wynika z nowego artykułu, rozdysponowanie majątkiem będącym własnością zagraniczną. Źródło: https://arxiv.org/src/2207.10931v1/anc/Offshore_London_Supplementary_Material.pdf

W artykule zauważono:

„W rzeczywistości tylko 4 terytoria: Brytyjskie Wyspy Dziewicze, Jersey, Guernsey i Wyspa Man, są powiązane z 78% wszystkich nieruchomości”.

Nowe, ulepszone dane umożliwiły określenie podnieruchomości istniejących w obrębie znanej nieruchomości będącej własnością za granicą – możliwość tę zwykle utrudniają płaskie i ograniczone dane podawane w oficjalnych danych.

Wyniki wskazują również, że nieruchomości offshore, Airbnb i nieruchomości o niskim zużyciu są znacznie bardziej skoncentrowane geograficznie niż zwykłe domy, a dodatkowo są skoncentrowane na obszarach o wyższej wartości.

Mapy cieplne dotyczące różnych typów nieruchomości będących własnością za granicą w Londynie. Źródło: https://arxiv.org/pdf/2207.10931.pdf

Wizualizowane mapy koncentracji związane z różnymi rodzajami nieruchomości będących własnością za granicą w Londynie. Źródło: https://arxiv.org/pdf/2207.10931.pdf

Autorzy komentują powyższy wykres:

'Nieruchomości krajowe zlokalizowane poza granicami kraju występują w wyjątkowo dużych skupiskach, gdzie cały kompleks mieszkaniowy jest własnością spółki zlokalizowanej poza granicami kraju.'

Autorzy mają wydany kod dla ich rurociągu przetwarzania.

nowy papier jest zatytułowany Co znajduje się w pralni? Mapowanie i charakteryzowanie nieruchomości krajowych będących własnością zagraniczną w Londyniei pochodzi od naukowców z Wydziału Środowiska Budowlanego Bartlett na University College London oraz Wydziału Ekonomii Uniwersytetu w Kingston.

Rozwiązanie problemu

Autorzy zauważają, że po dziesięcioleciach wysiłków mających na celu kontrolę wykorzystania nieruchomości do celów prania pieniędzy w Wielkiej Brytanii, dopiero zwolnić opublikowanej przez brytyjską publikację listy brytyjskich nieruchomości będących własnością offshore Private Eye w 2015 r., aby skłonić rząd Wielkiej Brytanii do opublikowania regularnie aktualizowanej listy nieruchomości będących własnością offshore w większości Wielkiej Brytanii, tzw. Firmy zagraniczne posiadające nieruchomości w Anglii i Walii (OCOD).

Naukowcy zauważają, że chociaż OCOD stanowi krok naprzód w badaniach i analizach własności zagranicznej i potencjalnego prania pieniędzy w Wielkiej Brytanii, dane mają szereg ograniczeń, niektóre z nich są kluczowe:

„Adresy te mogą być niekompletne, zawierać zagnieżdżone nieruchomości, w przypadku gdy w jednym wierszu lub numerze tytułu istnieje wiele nieruchomości, nie zawierają też informacji, czy nieruchomość ma charakter domowy, służbowy czy inny.

„Tak słaba jakość danych utrudnia zrozumienie rozmieszczenia i charakterystyki nieruchomości zagranicznych w Wielkiej Brytanii”.

Szczególnie trudno jest uzyskać dane na temat nieruchomości wynajmowanych okazjonalnie, takich jak nieruchomości Airbnb, ponieważ publicznie dostępne dane są ograniczone lub nie istnieją. Dodatkowo Szkocja (część Wielkiej Brytanii) nie udostępnia publicznie własnego rejestru sprzedaży nieruchomości, w przeciwieństwie do Anglii i Walii.

Aby przeciwdziałać niektórym niespójnościom dotyczącym klasyfikacji nieruchomości, rząd Wielkiej Brytanii wprowadził unikalny numer referencyjny nieruchomości (UPRN), zaprojektowany w celu umożliwienia wyraźniejszych powiązań pomiędzy różnymi źródłami danych o nieruchomościach. Jednak autorzy zauważają* „choć korzystanie z UPRN jest obowiązkowe, prawie żaden departament rządowy go nie używa, co oznacza, że ​​łączenie danych wymaga zaawansowanych analiza danych umiejętności".

Celem nowego badania było zatem uczynienie danych bardziej szczegółowymi i wnikliwymi.

Gromadzenie i łączenie danych

W obrębie każdego kraju formaty adresów są zazwyczaj przewidywalne i spójne, co ma zastosowanie również do adresów w Wielkiej Brytanii. W związku z tym, w obliczu „płaskich”, tekstowych danych adresowych (takich jak te udostępniane przez OCOD), pojawiło się wiele rozwiązań open source do analizy adresów, umożliwiających porównywanie adresów z innymi źródłami danych.

Jednak wiele z nich jest przeszkolonych przy użyciu Otwórz mapę ulic dane, które mogą dawać adresy, które w rzeczywistości mogą zawierać dziesiątki, a nawet setki zagnieżdżonych podadresów (takich jak mieszkania pod adresem o szerokim zasięgu dla bloku mieszkalnego). W rezultacie nawet uznany parser adresów, taki jak libpostal ma miał trudności podczas próby przeanalizowania niekompletnych adresów.

Aby stworzyć parser dla swojego projektu, badacze z nowego artykułu wykorzystali szereg publicznie dostępnych zestawów danych. Kluczowe dane dostarczył OCOD, a komponent oczyszczania danych wykorzystał dane z rejestru gruntów. zestaw danych, Wraz z Oceny VOA zbiór danych wykazu oraz katalog kodów pocztowych Urzędu Statystyki Narodowej (ONSPD).

Dane Airbnb pochodzą z WewnątrzAirbnb domena obejmująca wyłącznie całe domy przeznaczone do wynajęcia, wykluczająca tym samym pierwotny proponowany przypadek użycia Airbnb (tj. wynajmowanie całości lub części swojego domu okazjonalnie).

Zbiór danych autorów o nieruchomościach rzadko użytkowanych został uzupełniony informacjami uzyskanymi w wyniku pomyślnych wniosków o udostępnienie informacji publicznej (FOI), zebranych głównie na potrzeby wcześniejszy projekt.

Podstawowymi danymi OCOD jest plik .CSV rozdzielany przecinkami, o dobrym stopniu struktury i przewidywalnym formacie.

Rurociąg składał się z pięciu etapów: etykietowania, analizowania, rozwijania, klasyfikowania i kontraktowania. Na początku każdy indywidualny adres może w rzeczywistości zostać przekształcony w wiele zagnieżdżonych właściwości, choć nie jest to jednoznaczne z danymi dostarczonymi przez rząd.

Naukowcy przeprowadzili lekkie przetwarzanie składniowe, a następnie zaimportowali dane do programowy, platformę zaprojektowaną do tworzenia zestawów danych NLP z adnotacjami bez ręcznego etykietowania. Tutaj encje zostały oznaczone za pomocą wyrażeń regularnych (Regex) w celu opisania ośmiu typów nazwanych encji (patrz obrazek poniżej):

Po dodaniu tych etykiet zestaw danych został wyodrębniony jako plik JSON, a nakładanie się etykiet zostało usunięte za pomocą prostych procedur opartych na regułach.

Dodatkowo, wyniki programmatic wykorzystano do trenowania modelu predykcyjnego dla SpaCy, wspierany przez Facebooka Roberta. Po odszumieniu naukowcy stworzyli podstawowy zestaw porównawczy 1000 losowo oznakowanych obserwacji. Wynik dokładności danych nienadzorowanych zostałby ostatecznie oceniony w oparciu o tę podstawową prawdę.

Analiza adresów stwarzała wiele wyzwań. Autorzy przypisali każdemu zakresowi znaków własny wiersz, a każdej klasie etykiety własną kolumnę, a następnie dokonali propagacji wstecznej kolumn, aby wygenerować pełne wiersze adresów.

Ponieważ w przypadku niektórych pojedynczych adresów znajdowało się wiele różnych mieszkań, konieczne było rozszerzenie bazy danych poprzez podzielenie pojedynczych adresów na podobiekty występujące w uzupełniających bazach danych.

Następnie na etapie klasyfikacji adresów dokonano porównania wszystkich zlokalizowanych kodów pocztowych przy użyciu bazy danych ONSPD. Ten wygląda tak łączy dane adresowe ze spisami ludności i innymi danymi demograficznymi, a także wyodrębnia podwłaściwości, które wcześniej były ukryte za nieprzezroczystymi adresami danych OCOD.

Na koniec proces zawężania adresu odfiltrował wszystkie nieruchomości niemieszkalne (tj. lokale komercyjne) z zagnieżdżonych grup nieruchomości.

Analiza

Aby przetestować dokładność rozszerzonych danych, autorzy, jak wspomniano wcześniej, utworzyli przykładowy zbiór prawdy, który został wstrzymany z ogólnego przebiegu analiz i wykorzystany wyłącznie do sprawdzenia dokładności przewidywań i analiz.

Ręczne sprawdzanie rzetelności obejmowało wykorzystanie oprogramowania mapowego, a także analizę zdjęć nieruchomości znajdujących się w zatrzymanym zestawie oraz wyszukiwanie w Internecie w celu oceny rodzaju nieruchomości. Następnie wydajność danych mierzono pod kątem precyzji, zapamiętywania i wyników F1.

Wartość majątku małoużytkowego i krajowego uzyskano za pomocą podstawowego modelu graficznego, tą samą metodą stosowano również do wnioskowania o właściwościach UDP.

Zadanie NER, przetestowane pod kątem wymagającego dużego wysiłku, ręcznie oznaczonego testu prawdy rzeczywistej, uzyskało wynik F1 wynoszący 0.96 (blisko „100%” pod względem dokładności).

Wyniki F1 za zadanie etykietowania NER. Stwierdzono pewną nierówność, ponieważ w procesie tym nieznacznie zawyżono liczbę nieruchomości krajowych, a zaniżono całkowitą liczbę przedsiębiorstw, ze względu na strukturę rozszerzonych danych.

Wyniki F1 za zadanie etykietowania NER. Stwierdzono pewną nierówność, ponieważ w procesie tym nieznacznie zawyżono liczbę nieruchomości krajowych, a zaniżono całkowitą liczbę przedsiębiorstw, ze względu na strukturę rozszerzonych danych.

Jeśli chodzi o UDP w Londynie, ostateczne wyniki pokazują łącznie 138,000 44 wpisów – o 94,000% więcej niż XNUMX XNUMX uwzględnionych w oryginalnym zbiorze danych OCOD (tj. najnowszych oficjalnych danych).

Podział typów nieruchomości w ramach klasyfikacji typu 2.

Podział typów nieruchomości w ramach klasyfikacji typu 2.

Wyniki wskazują, że łączna wartość nieruchomości offshore wynosi około 56 miliardów funtów, podczas gdy łączna wartość nieruchomości o niskim stopniu użytkowania szacowana jest na 85 miliardów funtów.

Autorzy zauważają:

„[Wszystkie] nieruchomości UDP są znacznie droższe od przeciętnej ceny konwencjonalnej nieruchomości wynoszącej 600 tys. funtów”.

Tego rodzaju ulepszone dane mogą być konieczne do zwalczania wykorzystywania spekulacji na rynku nieruchomości do prania pieniędzy w Wielkiej Brytanii. Autorzy zwracają uwagę na rosnącą liczbę badań i literatury ogólnej, która sugeruje, że ulepszone dane mogą pomóc w zwalczaniu spekulacji na rynku nieruchomości w ramach przeciwdziałania praniu pieniędzy i podsumowują:

Dane te mogą zostać wykorzystane przez socjologów, ekonomistów i decydentów politycznych w celu zapewnienia, że ​​działania mające na celu ograniczenie prania pieniędzy i wysokich cen nieruchomości będą opierać się na szczegółowych danych odzwierciedlających rzeczywistą sytuację.

 

* Moja konwersja cytowań autorów na hiperłącza.

Opublikowano po raz pierwszy 25 lipca 2022 r.

Autor tekstów o uczeniu maszynowym, specjalista domenowy w syntezie obrazów ludzkich. Były szef treści badawczych w Metaphysic.ai.
Strona osobista: martinanderson.ai
Kontakt: [email chroniony]
Twitter: @manders_ai