stub AI oferuje ulepszone śledzenie własności nieruchomości offshore w Wielkiej Brytanii – Unite.AI
Kontakt z nami

Artificial Intelligence

Sztuczna inteligencja oferuje ulepszone śledzenie własności nieruchomości offshore w Wielkiej Brytanii

mm
Zaktualizowano on

Nowe badanie przeprowadzone na dwóch brytyjskich uniwersytetach ma na celu rzucić więcej światła na potencjalny stan prania pieniędzy związanych z nieruchomościami w Wielkiej Brytanii, a zwłaszcza na wysoko cenionym londyńskim rynku nieruchomości.

Zgodnie z wynikami projektu, całkowita liczba „niekonwencjonalnych” nieruchomości mieszkalnych (tj. nieruchomości, które nie są wykorzystywane długoterminowo jako mieszkania przez właścicieli lub najemców) w samym Londynie wynosi około 138,000 XNUMX.

Liczba ta jest o 44% wyższa niż oficjalne dane podawane i okresowo aktualizowane przez rząd Wielkiej Brytanii.

Naukowcy wykorzystali różne techniki przetwarzania języka naturalnego (NLP), wraz z dodatkowymi danymi i badaniami potwierdzającymi, aby poszerzyć ograniczone oficjalne informacje udostępniane przez rząd Wielkiej Brytanii na temat odsetka, wartości, lokalizacji i rodzajów nieruchomości będących w posiadaniu spółek offshore w Wielkiej Brytanii , z których najbardziej dochodowe znajdują się w stolicy.

Badanie wykazało, że łączna wartość nieruchomości offshore, o niskim zużyciu i w stylu airbnb (tj. „dorywczo zajętych”) w Wielkiej Brytanii wynosi od 145 do 174 miliardów funtów brytyjskich i obejmuje około 144,000 164,000–XNUMX XNUMX nieruchomości.

Ustalono również, że tego typu nieruchomości na morzu są zazwyczaj droższe i mają charakterystyczne wzorce w zależności od tego, gdzie się znajdują w Wielkiej Brytanii.

Naukowcy szacują, że jest to własność offshore Niekonwencjonalna nieruchomość domowa (UDP) stanowi 7.5% całkowitej wartości krajowej, a szacowana wartość 56 miliardów funtów ogranicza się do zaledwie 42,000 XNUMX mieszkań.

Artykuł stwierdza:

„Pojedyncze nieruchomości offshore są bardzo drogie nawet jak na standardy UDP, w dodatku są skoncentrowane w centrum Londynu z silną autokorelacją przestrzenną.

„W przeciwieństwie do zagnieżdżonych nieruchomości offshore, które są nieco mniej skoncentrowane w centrum Londynu, ale ogólnie w większym stopniu, nie ma też prawie żadnej korelacji przestrzennej”.

Analiza rozszerzonych danych pokazuje, że duża liczba nieruchomości offshore należy do podmiotów z branży Zależności tłumu (CD), przy czym drugą co do wielkości liczbę stanowią brytyjskie terytoria zamorskie (na poniższym wykresie „PWW2” oznacza kraje, które uzyskały niepodległość od Wielkiej Brytanii po drugiej wojnie światowej).

Jak wynika z nowego artykułu, rozdysponowanie majątkiem będącym własnością zagraniczną. Źródło: https://arxiv.org/src/2207.10931v1/anc/Offshore_London_Supplementary_Material.pdf

Jak wynika z nowego artykułu, rozdysponowanie majątkiem będącym własnością zagraniczną. Źródło: https://arxiv.org/src/2207.10931v1/anc/Offshore_London_Supplementary_Material.pdf

W artykule zauważono:

„W rzeczywistości tylko 4 terytoria: Brytyjskie Wyspy Dziewicze, Jersey, Guernsey i Wyspa Man są powiązane z 78% wszystkich nieruchomości”.

Nowe, ulepszone dane umożliwiły określenie podnieruchomości istniejących w obrębie znanej nieruchomości będącej własnością za granicą – możliwość tę zwykle utrudniają płaskie i ograniczone dane podawane w oficjalnych danych.

Wyniki wskazują również, że nieruchomości offshore, Airbnb i nieruchomości o niskim zużyciu są znacznie bardziej skoncentrowane geograficznie niż zwykłe domy, a dodatkowo są skoncentrowane na obszarach o wyższej wartości.

Mapy cieplne dotyczące różnych typów nieruchomości będących własnością za granicą w Londynie. Źródło: https://arxiv.org/pdf/2207.10931.pdf

Wizualizowane mapy koncentracji związane z różnymi rodzajami nieruchomości będących własnością za granicą w Londynie. Źródło: https://arxiv.org/pdf/2207.10931.pdf

Autorzy komentują powyższy wykres:

„Nieruchomości krajowe na morzu charakteryzują się wyjątkowo dużą koncentracją, gdy całe osiedle mieszkaniowe jest własnością spółki offshore”.

Autorzy mają wydany kod dla ich rurociągu przetwarzania.

Połączenia nowy papier jest zatytułowany Co jest w pralni? Mapowanie i charakterystyka nieruchomości krajowych będących własnością offshore w Londyniei pochodzi od naukowców z Wydziału Środowiska Budowlanego Bartlett na University College London oraz z Wydziału Ekonomii Uniwersytetu Kingston.

Rozwiązanie problemu

Autorzy zauważają, że po dziesięcioleciach wysiłków mających na celu kontrolę wykorzystania nieruchomości do celów prania pieniędzy w Wielkiej Brytanii, dopiero zwolnić opublikowanej przez brytyjską publikację listy brytyjskich nieruchomości będących własnością offshore Private Eye w 2015 r., aby skłonić rząd Wielkiej Brytanii do opublikowania regularnie aktualizowanej listy nieruchomości będących własnością offshore w większości Wielkiej Brytanii, tzw. Firmy zagraniczne posiadające nieruchomości w Anglii i Walii (OCOD).

Naukowcy zauważają, że chociaż OCOD stanowi krok naprzód w badaniach i analizach własności zagranicznej i potencjalnego prania pieniędzy w Wielkiej Brytanii, dane mają szereg ograniczeń, niektóre z nich są kluczowe:

„Adresy te mogą być niekompletne, zawierać zagnieżdżone nieruchomości, w przypadku gdy w jednym wierszu lub numerze tytułu istnieje wiele nieruchomości, nie zawierają też informacji, czy nieruchomość ma charakter domowy, służbowy czy inny.

„Takie dane niskiej jakości utrudniają zrozumienie rozmieszczenia i charakterystyki nieruchomości będących własnością offshore w Wielkiej Brytanii”.

Szczególnie trudno jest uzyskać dane na temat nieruchomości wynajmowanych okazjonalnie, takich jak nieruchomości Airbnb, ponieważ publicznie dostępne dane są ograniczone lub nie istnieją. Dodatkowo Szkocja (część Wielkiej Brytanii) nie udostępnia publicznie własnego rejestru sprzedaży nieruchomości, w przeciwieństwie do Anglii i Walii.

Aby przeciwdziałać niektórym niespójnościom dotyczącym klasyfikacji nieruchomości, rząd Wielkiej Brytanii wprowadził unikalny numer referencyjny nieruchomości (UPRN), zaprojektowany w celu umożliwienia wyraźniejszych powiązań pomiędzy różnymi źródłami danych o nieruchomościach. Jednak autorzy zauważają* „choć korzystanie z UPRN jest obowiązkowe, prawie żaden departament rządowy go nie używa, co oznacza, że ​​łączenie danych wymaga zaawansowanych analiza danych umiejętności".

Celem nowego badania było zatem uczynienie danych bardziej szczegółowymi i wnikliwymi.

Gromadzenie i łączenie danych

W każdym kraju formaty adresów są zwykle przewidywalne i spójne i mają zastosowanie również do adresów w Wielkiej Brytanii. Zatem w obliczu „płaskich” adresowanych danych tekstowych (takich jak te dostarczane przez OCOD) pojawiło się wiele rozwiązań do analizy adresów typu open source, które umożliwiają powiązanie adresów z innymi źródłami danych.

Jednak wiele z nich jest przeszkolonych przy użyciu Otwórz mapę ulic dane, które mogą dawać adresy, które w rzeczywistości mogą zawierać dziesiątki, a nawet setki zagnieżdżonych podadresów (takich jak mieszkania pod adresem o szerokim zasięgu dla bloku mieszkalnego). W rezultacie nawet uznany parser adresów, taki jak libpostal ma miał trudności podczas próby przeanalizowania niekompletnych adresów.

Aby stworzyć parser dla swojego projektu, badacze pracujący nad nowym artykułem wykorzystali szereg publicznie dostępnych zbiorów danych. Kluczowe dane dostarczyła firma OCOD, natomiast w komponencie oczyszczania danych wykorzystano Cenę Ksiąg Wieczystych zestaw danych, Wraz z Oceny VOA zbiór danych wykazu oraz katalog kodów pocztowych Urzędu Statystyki Narodowej (ONSPD).

Dane Airbnb pochodzą z WewnątrzAirbnb domena, która obejmuje wyłącznie całe domy do wynajęcia, wykluczając tym samym pierwotnie proponowany przypadek użycia Airbnb (tj. okazjonalne wynajmowanie całości lub części własnego domu).

Zbiór danych autorów dotyczących rzadko używanych nieruchomości został powiększony o informacje otrzymane z pomyślnie zakończonych wniosków o wolność informacji (FOI), zebranych głównie w celu wcześniejszy projekt.

Podstawowymi danymi OCOD jest plik .CSV rozdzielany przecinkami, o dobrym stopniu struktury i przewidywalnym formacie.

Rurociąg składał się z pięciu etapów: etykietowania, analizowania, rozwijania, klasyfikowania i kontraktowania. Na początku każdy indywidualny adres może w rzeczywistości zostać przekształcony w wiele zagnieżdżonych właściwości, choć nie jest to jednoznaczne z danymi dostarczonymi przez rząd.

Naukowcy przeprowadzili lekkie przetwarzanie składniowe, a następnie zaimportowali dane do programowy, platformę zaprojektowaną do tworzenia zestawów danych NLP z adnotacjami bez ręcznego etykietowania. Tutaj encje zostały oznaczone za pomocą wyrażeń regularnych (Regex) w celu opisania ośmiu typów nazwanych encji (patrz obrazek poniżej):

Po dodaniu tych etykiet zestaw danych został wyodrębniony jako plik JSON, a nakładanie się etykiet zostało usunięte za pomocą prostych procedur opartych na regułach.

Dodatkowo dane wyjściowe programu programmatic zostały wykorzystane do wyszkolenia modelu predykcyjnego SpaCy, wspierany przez Facebooka Roberta. Po odszumieniu naukowcy stworzyli podstawowy zestaw porównawczy 1000 losowo oznakowanych obserwacji. Wynik dokładności danych nienadzorowanych zostałby ostatecznie oceniony w oparciu o tę podstawową prawdę.

Analiza adresów stwarzała wiele wyzwań. Autorzy przypisali każdemu zakresowi znaków własny wiersz, a każdej klasie etykiety własną kolumnę, a następnie dokonali propagacji wstecznej kolumn, aby wygenerować pełne wiersze adresów.

Ponieważ w przypadku niektórych pojedynczych adresów znajdowało się wiele różnych mieszkań, konieczne było rozszerzenie bazy danych poprzez podzielenie pojedynczych adresów na podobiekty występujące w uzupełniających bazach danych.

Następnie na etapie klasyfikacji adresów dokonano porównania wszystkich zlokalizowanych kodów pocztowych przy użyciu bazy danych ONSPD. Ten wygląda tak łączy dane adresowe ze spisami ludności i innymi danymi demograficznymi, a także wyodrębnia podwłaściwości, które wcześniej były ukryte za nieprzezroczystymi adresami danych OCOD.

Na koniec proces zawężania adresu odfiltrował wszystkie nieruchomości niemieszkalne (tj. lokale komercyjne) z zagnieżdżonych grup nieruchomości.

Analiza

Aby przetestować dokładność rozszerzonych danych, autorzy, jak wspomniano wcześniej, utworzyli przykładowy zbiór prawdy, który został wstrzymany z ogólnego przebiegu analiz i wykorzystany wyłącznie do sprawdzenia dokładności przewidywań i analiz.

Ręczne sprawdzanie rzetelności obejmowało wykorzystanie oprogramowania mapowego, a także analizę zdjęć nieruchomości znajdujących się w zatrzymanym zestawie oraz wyszukiwanie w Internecie w celu oceny rodzaju nieruchomości. Następnie wydajność danych mierzono pod kątem precyzji, zapamiętywania i wyników F1.

Wartość majątku małoużytkowego i krajowego uzyskano za pomocą podstawowego modelu graficznego, tą samą metodą stosowano również do wnioskowania o właściwościach UDP.

Zadanie NER, przetestowane w oparciu o wymagającą dużego wysiłku, ręcznie oznaczoną prawdę podstawową, uzyskało wynik F1 na poziomie 0.96 (blisko „100%” pod względem dokładności).

Wyniki F1 za zadanie etykietowania NER. Stwierdzono pewną nierówność, ponieważ w procesie tym nieznacznie zawyżono liczbę nieruchomości krajowych, a zaniżono całkowitą liczbę przedsiębiorstw, ze względu na strukturę rozszerzonych danych.

Wyniki F1 za zadanie etykietowania NER. Stwierdzono pewną nierówność, ponieważ w procesie tym nieznacznie zawyżono liczbę nieruchomości krajowych, a zaniżono całkowitą liczbę przedsiębiorstw, ze względu na strukturę rozszerzonych danych.

Jeśli chodzi o UDP w Londynie, ostateczne wyniki pokazują łącznie 138,000 44 wpisów – o 94,000% więcej niż XNUMX XNUMX uwzględnionych w oryginalnym zbiorze danych OCOD (tj. najnowszych oficjalnych danych).

Podział typów nieruchomości w ramach klasyfikacji typu 2.

Podział typów nieruchomości w ramach klasyfikacji typu 2.

Wyniki wskazują, że łączna wartość nieruchomości offshore wynosi około 56 miliardów funtów, podczas gdy łączna wartość nieruchomości o niskim stopniu użytkowania szacowana jest na 85 miliardów funtów.

Autorzy zauważają:

„[Wszystkie] UDP są znacznie droższe niż średnia cena nieruchomości konwencjonalnych wynosząca 600 tysięcy funtów”.

Tego rodzaju ulepszone dane mogą być konieczne do zwalczania wykorzystywania spekulacji na rynku nieruchomości do prania pieniędzy w Wielkiej Brytanii. Autorzy zwracają uwagę na rosnącą liczbę badań i literatury ogólnej, która sugeruje, że ulepszone dane mogą pomóc w zwalczaniu spekulacji na rynku nieruchomości w ramach przeciwdziałania praniu pieniędzy i podsumowują:

„Dane te mogą zostać wykorzystane przez socjologów, ekonomistów i decydentów, aby zapewnić, że próby ograniczenia prania pieniędzy i wysokich cen nieruchomości będą opierać się na szczegółowych danych odzwierciedlających rzeczywistą sytuację”.

 

* Moja konwersja cytatów autorów w tekście na hiperłącza.

Opublikowano po raz pierwszy 25 lipca 2022 r.