кочан AI предлага подобрено проследяване на собственост върху офшорни имоти в Обединеното кралство – Unite.AI
Свържете се с нас

Изкуствен интелект

AI предлага подобрено проследяване на собственост върху офшорни имоти в Обединеното кралство

mm
Обновено on

Ново изследване от два университета в Обединеното кралство има за цел да хвърли по-голяма светлина върху потенциалното състояние на прането на пари, основано на собственост, в Обединеното кралство и особено на високо ценения пазар на недвижими имоти в Лондон.

Според резултатите от проекта общият брой на „неконвенционалните“ домашни имоти (т.е. имоти, които не се използват дългосрочно като жилища от собственици или наематели) възлиза на около 138,000 XNUMX само в Лондон.

Тази цифра е с 44% по-висока от официалните цифри, които се предоставят и периодично актуализират от правителството на Обединеното кралство.

Изследователите са използвали различни техники за обработка на естествен език (NLP), заедно с допълнителни данни и потвърждаващи изследвания, за да разширят ограничената официална информация, която правителството на Обединеното кралство предоставя за процента, стойността, местоположението и видовете собственост, притежавани от офшорни компании в Обединеното кралство , най-доходоносните от които са в столицата.

Проучването установи, че общото количество офшорни, слабо използвани и имоти в стил airbnb (т.е. „случайно обитаване“) в Обединеното кралство струват някъде между £145-174 милиарда GBP в приблизително 144,000 164,000-XNUMX XNUMX имота.

Той също така установи, че офшорните имоти от този тип обикновено са по-скъпи и имат характерни модели по отношение на това къде се намират в Обединеното кралство.

Изследователите изчисляват, че офшорна собственост Нетрадиционна домашна собственост (UDP) представлява 7.5% от общата вътрешна стойност и тези £56 милиарда от изчислената стойност са ограничени до само 42,000 XNUMX жилища.

В статията се посочва:

„Индивидуалните офшорни имоти са много скъпи дори по стандартите на UDP, освен това те са концентрирани в центъра на Лондон със силна пространствена автокорелация.

„За разлика от това вложените офшорни имоти са малко по-малко концентрирани в централен Лондон, но по-силно концентрирани като цяло, също така почти няма пространствена корелация.“

Анализът на разширените данни показва, че голям брой офшорни имоти принадлежат на субекти в Зависимости от тълпата (CD), като вторият по големина брой се отчита от британските отвъдморски територии (в диаграмата по-долу „PWW2“ означава държави, получили независимост от Великобритания след Втората световна война).

Разпореждане с чуждо имущество, според резултатите от новия доклад. Източник: https://arxiv.org/src/2207.10931v1/anc/Offshore_London_Supplementary_Material.pdf

Разпореждане с чуждо имущество, според резултатите от новия доклад. Източник: https://arxiv.org/src/2207.10931v1/anc/Offshore_London_Supplementary_Material.pdf

Документът отбелязва:

„Всъщност само 4 територии, Британски Вирджински острови, Джърси, Гърнси и остров Ман, са свързани със 78% от всички имоти.“

Новите подобрени данни направиха възможно да се определят под-собствености, които съществуват в известен имот, притежаван в чужбина – възможност, която обикновено се възпрепятства от плоските и ограничени данни, предоставени в официалните данни.

Резултатите също така показват, че офшорните, Airbnb и имотите с ниска употреба са значително по-концентрирани географски от нормалните домове и са допълнително концентрирани в райони с по-висока стойност.

Топлинни карти, свързани с различни видове собственост в чужбина в Лондон. Източник: https://arxiv.org/pdf/2207.10931.pdf

Визуализирани карти на концентрация, свързани с различни видове собственост в чужбина в Лондон. Източник: https://arxiv.org/pdf/2207.10931.pdf

От горната графика авторите коментират:

„Офшорната местна собственост има някои изключително високи концентрации, когато целият жилищен комплекс е собственост на офшорна компания.“

Авторите имат пуснат код за техния тръбопровод за обработка.

- нова хартия е озаглавен Какво има в пералнята? Картографиране и характеризиране на офшорна собственост в Лондон, и идва от изследователи от Факултета за изградена среда Бартлет в Лондонския университетски колеж и Икономическия факултет на университета Кингстън.

Справяне с проблема

Авторите отбелязват, че след десетилетия усилия за контролиране на използването на недвижими имоти с цел пране на пари в Обединеното кралство, отне освободи на изтекъл списък с офшорна собственост в Обединеното кралство от британското издание Частен детектив през 2015 г., за да насърчи правителството на Обединеното кралство да публикува редовно актуализиран списък на офшорни имоти в по-голямата част от Обединеното кралство, известни като Отвъдморски компании, които притежават имоти в Англия и Уелс (OCOD).

Изследователите отбелязват, че въпреки че OCOD е стъпка напред към изследването и анализа на задграничната собственост и потенциалното пране на пари в Обединеното кралство, данните имат редица ограничения, някои от които са изключително важни:

„Тези адреси може да са непълни, да съдържат вложени свойства, където съществуват множество свойства в рамките на един ред или номер на заглавие, също така не съдържа информация дали собствеността е домашна, бизнес или нещо друго.

„Подобни данни с лошо качество правят разбирането на разпределението и характеристиките на офшорната собственост в Обединеното кралство предизвикателство.“

Особено трудно е да се получат данни за случайно наети имоти, като имотите на Airbnb, тъй като публично достъпните данни са ограничени или несъществуващи. Освен това Шотландия (част от Обединеното кралство) не прави публично достъпен собствен регистър за продажби на имоти, за разлика от Англия и Уелс.

За да се противопостави на някои от несъответствията около класификацията на собствеността, правителството на Обединеното кралство въведе уникален референтен номер на собственост (UPRN), предназначена да позволи по-ясни връзки между различни източници на данни за имоти. Въпреки това, авторите отбелязват * „докато използването на UPRN е задължително, почти никой държавен отдел не го използва, което означава, че свързването на данните изисква напреднали обработка на данни умения".

Така новото изследване има за цел да направи данните по-подробни и проницателни.

Събиране и свързване на данните

Във всяка отделна държава адресните формати обикновено са предвидими и последователни, приложими също и за адреси в Обединеното кралство. По този начин, изправени пред „плоски“, текстови адресирани данни (като тези, предоставени от OCOD), се появиха редица решения за парсиране на адреси с отворен код за кръстосано препращане на адреси към други източници на данни.

Много от тях обаче са обучени да използват Отворете карта на улицата данни, които могат да дадат адреси, които всъщност могат да съдържат десетки или дори стотици вложени под-адреси (като апартаменти в широкообхватен адрес за жилищен блок). Следователно, дори всепризнат анализатор на адреси като напр libpostal има имаше затруднения когато се опитвате да анализирате непълни адреси.

За да създадат анализатора за техния проект, изследователите на новата статия са използвали редица публично достъпни набори от данни. Ключовите данни бяха предоставени от OCOD, докато компонентът за почистване на данни използва цената на имотния регистър набор от данни, Заедно с Оценки на VOA списък с данни и указател на пощенските кодове на Службата на националната статистика (ONSPD).

Данните на Airbnb идват от InsideAirbnb домейн, който включва само цели домове, които се отдават под наем, като следователно изключва първоначалния предложен случай на използване на Airbnb (т.е. отдаване под наем на целия или на част от собствения дом на случаен принцип).

Наборът от данни за имоти с ниска употреба на авторите беше допълнен с информация, получена от успешни заявки за свобода на информацията (FOI), събрани предимно за по-ранен проект.

Базовите данни на OCOD са .CSV файл, разделен със запетая, с добра степен на структура и предвидим формат.

Конвейерът се състоеше от пет етапа: етикетиране, анализиране, разширяване, класифициране и свиване. В началото всеки отделен адрес може да се разреши в реалния живот на множество вложени свойства, въпреки че това не е изрично в предоставените от правителството данни.

Изследователите извършиха лека синтактична предварителна обработка, след което импортираха данните в програмна, платформа, предназначена за създаване на анотирани NLP набори от данни без ръчно етикетиране. Тук обектите бяха етикетирани с помощта на регулярни изрази (Regex), за да опишат осем типа наименувани обекти (вижте изображението по-долу):

С тези добавени етикети наборът от данни беше извлечен като JSON файл, като припокриванията на етикети бяха премахнати чрез прости рутинни процедури, базирани на правила.

Освен това изходът на programmatic беше използван за обучение на прогнозен модел за SpaCy, подкрепени от Facebook RoBERTa. Веднъж премахнати, изследователите създадоха набор от 1000 произволно маркирани наблюдения. Резултатът за точност на неконтролираните данни в крайна сметка ще бъде оценен спрямо тази основна истина.

Разборът на адреси представлява редица предизвикателства. Авторите присвоиха на всеки символ обхват на собствен ред и на всеки клас етикети своя собствена колона и след това разпространиха обратно колоните, за да генерират пълни адресни редове.

Тъй като някои единични адреси включват множество отделни жилища, беше необходимо да се разшири базата данни, като се разделят отделните адреси на подсвойства, присъстващи в допълващи се бази данни.

След това етапът на класифициране на адреси направи кръстосани препратки към всички разположени пощенски кодове, използвайки базата данни ONSPD. Това процес свързва адресните данни с данни от преброяване и други демографски данни, а също така индивидуализира под-свойства, които преди са били скрити зад непрозрачните адреси на данните от OCOD.

И накрая, процесът на свиване на адреси филтрира всички небитови имоти (т.е. търговски помещения) от вложени групи имоти.

Анализ

За да тестват точността на подобрените данни, авторите, както беше споменато по-рано, създадоха примерен набор от основни истини, който беше задържан от общия анализ и използван само за тестване на точността на прогнозите и анализите.

Ръчната проверка за истината на земята включваше използването на картографски софтуер, както и анализ на снимки на имотите, представени в задържания комплект, и на търсения в интернет за оценка на типа собственост. След това ефективността на данните беше измерена спрямо прецизност, припомняне и F1 резултати.

Стойността на слабо използваните и домашни имоти е получена с основен графичен модел, същият метод, използван и за извеждане на UDP свойства.

Задачата NER, тествана срещу изискващата много усилия, ръчно етикетирана наземна истина, получи F1 резултат от 0.96 (близо до „100%“ по отношение на точност).

Резултати F1 за задачата за етикетиране на NER. Установени са известни неравномерности, тъй като процесът леко надценява броя на местните имоти и подценява общия брой на предприятията поради структурата на подобрените данни.

Резултати F1 за задачата за етикетиране на NER. Установени са известни неравномерности, тъй като процесът леко надценява броя на местните имоти и подценява общия брой на предприятията поради структурата на подобрените данни.

По отношение на UDP в Лондон, окончателните резултати показват общо 138,000 44 записа – 94,000% повече от XNUMX XNUMX, представени в оригиналния набор от данни OCOD (т.е. скорошни официални данни).

Разбивката на видовете имоти по класификация тип 2.

Разбивката на видовете имоти по класификация тип 2.

Резултатите показват, че общата стойност на офшорните имоти възлиза на около £56 милиарда, докато общата стойност на имотите с ниска употреба се оценява на £85 милиарда.

Авторите отбелязват:

„[Всички] UDP са много по-скъпи от средната цена на конвенционален имот от £600 хиляди.“

Този вид подобрени данни може да са необходими за борба с използването на спекулации с имоти като дейност за пране на пари в Обединеното кралство. Авторите отбелязват нарастващия брой изследвания и обща литература, които предполагат, че подобрените данни могат да помогнат в борбата с спекулациите с AML имоти и заключават:

„Тези данни могат да се използват от социолози, икономисти и политици, за да се гарантира, че опитите за намаляване на прането на пари и високите цени на имотите се основават на подробни данни, които отразяват реалната ситуация.“

 

* Моето преобразуване на вграденото цитиране на авторите в хипервръзки.

Първо публикувано на 25 юли 2022 г.