Свяжитесь с нами:

ИИ предлагает улучшенное отслеживание владения оффшорной недвижимостью в Великобритании

Искусственный интеллект

ИИ предлагает улучшенное отслеживание владения оффшорной недвижимостью в Великобритании

mm

Новое исследование, проведенное двумя британскими университетами, направлено на то, чтобы пролить свет на потенциальное состояние отмывания денег, основанного на собственности, в Соединенном Королевстве, и особенно на высоко ценимом лондонском рынке недвижимости.

Согласно результатам проекта, общее количество «нетрадиционных» объектов жилой недвижимости (т. е. объектов, которые не используются в качестве жилья в течение длительного времени владельцами или арендаторами) только в Лондоне составляет около 138,000 XNUMX.

Эта цифра на 44% выше официальных данных, которые предоставляются и периодически обновляются правительством Великобритании.

Исследователи использовали различные методы обработки естественного языка (NLP), а также дополнительные данные и подтверждающие исследования, чтобы расширить ограниченную официальную информацию, которую правительство Великобритании предоставляет о проценте, стоимости, местоположении и типах собственности, принадлежащей оффшорным компаниям в Великобритании. , самые прибыльные из которых находятся в столице.

Исследование показало, что общая стоимость офшорной, малоиспользуемой и доступной в стиле Airbnb (т. е. «временного проживания») недвижимости в Великобритании составляет где-то от 145 до 174 миллиардов фунтов стерлингов, а это примерно 144,000 164,000–XNUMX XNUMX объектов недвижимости.

Также было установлено, что офшорная недвижимость такого типа, как правило, стоит дороже и имеет характерные особенности, связанные с местом ее расположения в Великобритании.

По оценкам исследователей, офшорные Нетрадиционная домашняя недвижимость (UDP) составляет 7.5% от общей внутренней стоимости, и эта оценочная стоимость в размере 56 миллиардов фунтов стерлингов ограничена всего 42,000 XNUMX жилищами.

В документе говорится:

«Отдельные оффшорные объекты очень дороги даже по меркам UDP, к тому же они сконцентрированы в центре Лондона с сильной пространственной автокорреляцией.

«Напротив, вложенная офшорная недвижимость несколько меньше сконцентрирована в центре Лондона, но более сконцентрирована в целом, и здесь почти нет пространственной корреляции».

Анализ дополненных данных показывает, что большое количество оффшорных объектов принадлежит компаниям из Зависимости от толпы (CD), второе место по численности занимают Британские заморские территории (в приведенной ниже таблице «PWW2» обозначает страны, получившие независимость от Великобритании после Второй мировой войны).

Распоряжение имуществом, находящимся в иностранной собственности, по результатам новой бумаги. Источник: https://arxiv.org/src/2207.10931v1/anc/Offshore_London_Supplementary_Material.pdf

Распоряжение имуществом, находящимся в иностранной собственности, по результатам новой бумаги. Источник: https://arxiv.org/src/2207.10931v1/anc/Offshore_London_Supplementary_Material.pdf

В документе отмечается:

«На самом деле только четыре территории — Британские Виргинские острова, Джерси, Гернси и остров Мэн — связаны с 4% всех объектов недвижимости».

Новые расширенные данные позволили определить подобъекты собственности, которые существуют в пределах известной собственности, принадлежащей за границей, — возможность, обычно затрудненная из-за неполных и ограниченных данных, представленных в официальных данных.

Результаты также показывают, что оффшорная недвижимость, Airbnb и малоиспользуемая недвижимость заметно более географически сконцентрированы, чем обычные дома, и дополнительно сосредоточены в районах с более высокой стоимостью.

Тепловые карты, относящиеся к различным типам зарубежной собственности в Лондоне. Источник: https://arxiv.org/pdf/2207.10931.pdf

Визуализированные карты концентрации, относящиеся к различным типам зарубежной собственности в Лондоне. Источник: https://arxiv.org/pdf/2207.10931.pdf

На приведенном выше графике авторы комментируют:

«Концентрация зарубежной жилой недвижимости чрезвычайно высока, когда целые жилые комплексы принадлежат офшорной компании».

У авторов есть выпущенный код для конвейера их обработки.

Радиус корня Новый документ называется Что в прачечной? Картографирование и описание офшорной недвижимости в Лондоне.и исходит от исследователей факультета архитектуры Бартлетта Лондонского университетского колледжа и экономического факультета Кингстонского университета.

Решение проблемы

Авторы отмечают, что после десятилетий усилий по контролю за использованием недвижимости в целях отмывания денег в Соединенном Королевстве потребовалось освободить просочившегося списка британской оффшорной собственности, опубликованного британским изданием Частный сыщик в 2015 году, чтобы побудить правительство Великобритании публиковать регулярно обновляемый список оффшорной собственности на большей части территории Великобритании, известный как Зарубежные компании, владеющие недвижимостью в Англии и Уэльсе (ОКОД).

Исследователи отмечают, что, хотя OCOD является шагом вперед к исследованию и анализу зарубежной собственности и потенциального отмывания денег в Великобритании, данные имеют ряд ограничений, некоторые из которых имеют решающее значение:

«Эти адреса могут быть неполными, содержать вложенные свойства, где несколько свойств существуют в одной строке или номере заголовка, они также не содержат информации о том, является ли имущество домашним, коммерческим или чем-то еще.

«Такие некачественные данные затрудняют понимание распределения и характеристик офшорной собственности в Великобритании».

Особенно сложно получить данные о случайно арендованном имуществе, таком как недвижимость Airbnb, поскольку общедоступные данные ограничены или отсутствуют. Кроме того, Шотландия (часть Соединенного Королевства) не публикует собственный реестр продаж недвижимости, в отличие от Англии и Уэльса.

Чтобы устранить некоторые несоответствия в классификации собственности, правительство Великобритании ввело уникальный идентификационный номер собственности (УПРН), предназначенная для обеспечения более четких взаимосвязей между различными источниками данных о свойствах. Однако авторы отмечают* «Хотя использование UPRN является обязательным, почти ни одно правительственное ведомство не использует его, а это означает, что для связывания данных требуются расширенные обработка данных навыки".

Таким образом, новое исследование было направлено на то, чтобы сделать данные более детализированными и проницательными.

Сбор и соединение данных

В любой стране форматы адресов, как правило, предсказуемы и единообразны, что применимо и к адресам в Великобритании. Поэтому, столкнувшись с «плоскими» текстовыми адресными данными (например, предоставляемыми OCOD), появился ряд решений с открытым исходным кодом для анализа адресов, позволяющих сопоставлять адреса с другими источниками данных.

Однако многие из них обучаются с использованием Открыть карту улиц данные, которые могут дать адреса, которые могут фактически содержать десятки или даже сотни вложенных подадресов (например, квартиры в широком адресе для многоквартирного дома). Следовательно, даже известный анализатор адресов, такой как Libpostal и были трудности при попытке проанализировать неполные адреса.

Для создания парсера для своего проекта исследователи новой статьи использовали ряд общедоступных наборов данных. Ключевые данные были предоставлены OCOD, а компонент очистки данных использовал данные о ценах из Земельного кадастра. Набор данныхВместе с Рейтинги Голоса Америки набор данных со списком и справочник почтовых индексов Управления национальной статистики (ОНСПД).

Данные Airbnb поступили из ВнутриAirbnb домен, который включает только целые дома, сдаваемые в аренду, таким образом исключая первоначально предложенный вариант использования Airbnb (т. е. сдачу в аренду всего или части собственного дома на периодической основе).

Набор данных авторов о малоиспользуемой собственности был дополнен информацией, полученной из успешных запросов на свободу информации (FOI), собранных в основном для более ранний проект.

Базовые данные OCOD представляют собой файл .CSV с разделителями-запятыми, хорошей степенью структуры и предсказуемым форматом.

Конвейер состоял из пяти этапов: маркировка, синтаксический анализ, расширение, классификация и сжатие. Вначале любой отдельный адрес мог в реальной жизни разрешаться в несколько вложенных свойств, хотя это явно не указано в данных, предоставленных правительством.

Исследователи выполнили небольшую синтаксическую предварительную обработку, а затем импортировали данные в программный, платформа, предназначенная для создания аннотированных наборов данных NLP без ручной маркировки. Здесь объекты были помечены с использованием регулярных выражений (Regex) для описания восьми типов именованных объектов (см. изображение ниже):

После добавления этих меток набор данных был извлечен в виде файла JSON, а перекрытия меток были удалены с помощью простых процедур, основанных на правилах.

Кроме того, результаты программного обеспечения были использованы для обучения предиктивной модели для СпаСи, подкрепленный Facebook РОБЕРТа. После шумоподавления исследователи создали сравнительный набор из 1000 случайно помеченных наблюдений. Оценка точности неконтролируемых данных в конечном итоге будет оцениваться по сравнению с этой базовой истиной.

Парсинг адресов вызвал ряд проблем. Авторы назначили каждому символу span свою собственную строку и каждому классу метки свой собственный столбец, а затем распространили столбцы обратно для создания полных адресных строк.

Поскольку по некоторым отдельным адресам было несколько разных жилищ, необходимо было расширить базу данных, разделив отдельные адреса на подсобственность, присутствующую в дополнительных базах данных.

После этого на этапе классификации адресов были проведены перекрестные ссылки на все обнаруженные почтовые индексы с использованием базы данных ONSPD. Этот процесс связывает адресные данные с переписью и другими демографическими данными, а также выделяет подсвойства, которые ранее были скрыты за непрозрачными адресами данных OCOD.

Наконец, процесс сокращения адресов отфильтровал всю нежилую недвижимость (например, коммерческие помещения) из вложенных групп собственности.

Анализ

Чтобы проверить точность расширенных данных, авторы, как упоминалось ранее, создали выборку наземных данных, которая была исключена из общего цикла анализа и использовалась только для проверки точности прогнозов и анализов.

Ручная проверка достоверности информации включала использование картографического программного обеспечения, а также анализ изображений объектов, представленных в удерживаемом наборе, и поиск в Интернете для оценки типа объекта. После этого производительность данных измерялась по показателям точности, полноты и F1.

Стоимость малоиспользуемой и домашней собственности была получена с помощью базовой графической модели, тот же метод использовался также для вывода свойств UDP.

Тестирование задачи NER на основе маркированных вручную и требующих больших усилий истинных данных дало оценку F1 0.96 (близкую к «100%» с точки зрения точности).

Баллы F1 за задание по маркировке NER. Обнаружена некоторая неравномерность, так как процесс немного завышает количество объектов недвижимости и занижает общее количество предприятий из-за структуры расширенных данных.

Баллы F1 за задание по маркировке NER. Обнаружена некоторая неравномерность, так как процесс немного завышает количество объектов недвижимости и занижает общее количество предприятий из-за структуры расширенных данных.

Что касается UDP в Лондоне, окончательные результаты показывают в общей сложности 138,000 44 записей, что на 94,000% больше, чем XNUMX XNUMX в исходном наборе данных OCOD (т. е. последние официальные данные).

Разбивка типов собственности по классификации типа 2.

Разбивка типов собственности по классификации типа 2.

Результаты показывают, что общая стоимость оффшорной недвижимости составляет около 56 миллиардов фунтов стерлингов, а общая стоимость малоиспользуемой собственности оценивается в 85 миллиардов фунтов стерлингов.

Авторы отмечают:

«[Все] UDP стоят намного дороже средней цены на традиционную недвижимость в 600 тысяч фунтов стерлингов».

Такого рода улучшенные данные могут быть необходимы для борьбы с использованием спекуляции недвижимостью в качестве отмывания денег в Великобритании. Авторы отмечают растущий объем исследований и общей литературы, в которых предполагается, что улучшенные данные могут помочь в борьбе со спекуляцией недвижимостью в сфере ПОД, и заключают:

«Эти данные могут быть использованы социологами, экономистами и политиками для обеспечения того, чтобы попытки сократить отмывание денег и высокие цены на недвижимость основывались на подробных данных, отражающих реальную ситуацию».

 

* Мое преобразование ссылок на работы авторов в гиперссылки.

Впервые опубликовано 25 июля 2022 г.

Автор статей о машинном обучении, специалист по синтезу человеческих изображений. Бывший руководитель исследовательского контента в Metaphysic.ai.
Личный сайт: Мартинандерсон.ай
Контактное лицо: [электронная почта защищена]
Твиттер: @manders_ai