talon AI offre un suivi amélioré de la propriété de biens offshore au Royaume-Uni - Unite.AI
Suivez nous sur

Intelligence artificielle

L'IA offre un suivi amélioré de la propriété immobilière offshore au Royaume-Uni

mm
Le kit de préparation mis à jour on

Une nouvelle recherche de deux universités britanniques vise à mieux comprendre l'état potentiel du blanchiment d'argent basé sur la propriété au Royaume-Uni, et en particulier sur le marché immobilier très prisé de Londres.

Selon les résultats du projet, le nombre total de propriétés domestiques « non conventionnelles » (c'est-à-dire des propriétés qui ne sont pas utilisées à long terme comme logements par des propriétaires ou des locataires) s'élève à environ 138,000 XNUMX rien qu'à Londres.

Ce chiffre est supérieur de 44 % aux chiffres officiels, qui sont fournis et périodiquement mis à jour par le gouvernement britannique.

Les chercheurs ont utilisé diverses techniques de traitement du langage naturel (NLP), ainsi que des données supplémentaires et des recherches corroborantes, pour étendre les informations officielles limitées que le gouvernement britannique met à disposition sur le pourcentage, la valeur, l'emplacement et les types de propriétés détenues par des sociétés offshore au Royaume-Uni. , dont les plus lucratives se trouvent dans la capitale.

La recherche a révélé que le montant total des propriétés offshore, à faible utilisation et de style airbnb (c'est-à-dire «occupation occasionnelle») au Royaume-Uni vaut collectivement entre 145 et 174 milliards de livres sterling sur environ 144,000 164,000 à XNUMX XNUMX propriétés.

Il a également constaté que les propriétés offshore de ce type sont généralement plus chères et ont des modèles de signature en ce qui concerne leur emplacement au Royaume-Uni.

Les chercheurs estiment que les sociétés offshore Propriété domestique non conventionnelle (UDP) représente 7.5% de la valeur intérieure totale, et que 56 milliards de livres sterling de la valeur estimée se limitent à seulement 42,000 XNUMX logements.

Le papier déclare:

«Les propriétés offshore individuelles sont très chères même selon les normes de l'UDP, en plus elles sont concentrées sur le centre de Londres avec une forte auto-corrélation spatiale.

"En revanche, la propriété offshore imbriquée est un peu moins concentrée dans le centre de Londres mais plus fortement concentrée en général, il n'y a également presque aucune corrélation spatiale."

L'analyse des données augmentées montre qu'un grand nombre de propriétés offshore appartiennent à des entités du Dépendances de la foule (CD), le deuxième plus grand nombre étant représenté par les territoires britanniques d'outre-mer (dans le tableau ci-dessous, « PWW2 » signifie les pays qui ont obtenu leur indépendance de la Grande-Bretagne après la Seconde Guerre mondiale).

Disposition des biens appartenant à des étrangers, selon les résultats du nouveau document. Source : https://arxiv.org/src/2207.10931v1/anc/Offshore_London_Supplementary_Material.pdf

Disposition des biens appartenant à des étrangers, selon les résultats du nouveau document. Source : https://arxiv.org/src/2207.10931v1/anc/Offshore_London_Supplementary_Material.pdf

Le journal constate :

"En fait, seuls 4 territoires, les îles Vierges britanniques, Jersey, Guernesey et l'île de Man, sont associés à 78 % de toutes les propriétés."

Les nouvelles données améliorées ont permis de déterminer les sous-propriétés qui existent dans une propriété connue à l'étranger - une capacité généralement entravée par les données plates et limitées fournies dans les chiffres officiels.

Les résultats indiquent également que les propriétés offshore, Airbnb et à faible utilisation sont nettement plus concentrées géographiquement que les maisons normales, et sont en outre concentrées dans des zones à plus forte valeur.

Cartes thermiques liées à divers types de propriétés appartenant à l'étranger à Londres. Source : https://arxiv.org/pdf/2207.10931.pdf

Cartes de concentration visualisées liées à divers types de propriétés détenues à l'étranger à Londres. Source : https://arxiv.org/pdf/2207.10931.pdf

Sur le graphique ci-dessus, les auteurs commentent :

"La propriété domestique offshore a des concentrations extrêmement élevées où un lotissement entier appartient à une société offshore."

Les auteurs ont code publié pour leur pipeline de traitement.

Les nouveau papier est intitulé Qu'y a-t-il dans la laverie ? Cartographier et caractériser la propriété domestique détenue à l'étranger à Londres, et provient de chercheurs de la faculté Bartlett de l'environnement bâti de l'University College London et du département d'économie de l'Université de Kingston.

Aborder le problème

Les auteurs notent qu'après des décennies d'efforts pour contrôler l'utilisation de biens immobiliers à des fins de blanchiment d'argent au Royaume-Uni, il a fallu libérer d'une liste divulguée de propriétés britanniques détenues à l'étranger par la publication britannique Détective Privé en 2015 pour inciter le gouvernement britannique à publier une liste régulièrement mise à jour des propriétés offshore dans la majeure partie du Royaume-Uni, connue sous le nom de Entreprises étrangères qui possèdent des biens en Angleterre et au Pays de Galles (OCOD).

Les chercheurs observent que bien qu'OCOD soit un pas en avant dans la recherche et l'analyse de la propriété étrangère et du blanchiment d'argent potentiel au Royaume-Uni, les données présentent un certain nombre de limites, dont certaines sont cruciales :

«Ces adresses peuvent être incomplètes, contenir des propriétés imbriquées, où plusieurs propriétés existent dans une seule ligne ou un seul numéro de titre, elles ne contiennent également aucune information indiquant si la propriété est domestique, commerciale ou autre.

"De telles données de mauvaise qualité rendent difficile la compréhension de la distribution et des caractéristiques des biens immobiliers offshore au Royaume-Uni."

Il est particulièrement difficile d'obtenir des données sur les biens loués occasionnellement tels que les propriétés Airbnb, car les données accessibles au public sont limitées ou inexistantes. De plus, l'Écosse (qui fait partie du Royaume-Uni) ne met pas son propre registre des ventes immobilières à la disposition du public, contrairement à l'Angleterre et au Pays de Galles.

Pour contrer certaines des incohérences autour de la classification des propriétés, le gouvernement britannique a introduit le numéro de référence de propriété unique (UPRN), conçu pour permettre des relations plus claires entre diverses sources de données sur les propriétés. Cependant, les auteurs notent* "Alors que l'utilisation de l'UPRN est obligatoire, presque aucun ministère ne l'utilise, ce qui signifie que la liaison des données nécessite des informatique compétences».

Ainsi, la nouvelle recherche vise à rendre les données plus granulaires et perspicaces.

Collecte et connexion des données

Dans chaque pays, les formats d'adresse sont généralement prévisibles et cohérents, applicables également aux adresses britanniques. Ainsi, face à des données textuelles adressées "plates" (telles que celles fournies par OCOD), un certain nombre de solutions open source d'analyse d'adresses ont vu le jour pour croiser les adresses avec d'autres sources de données.

Cependant, beaucoup d'entre eux sont formés à l'aide de Ouvrir le plan des rues données, qui peuvent produire des adresses qui peuvent en fait héberger des dizaines, voire des centaines de sous-adresses imbriquées (telles que des appartements dans une adresse étendue pour un immeuble). Par conséquent, même un analyseur d'adresse acclamé tel que libpostal a eu des difficultés lors d'une tentative d'analyse d'adresses incomplètes.

Pour créer l'analyseur de leur projet, les chercheurs du nouveau document ont utilisé un certain nombre d'ensembles de données accessibles au public. Les données clés ont été fournies par OCOD, tandis que la composante de nettoyage des données a utilisé le prix du cadastre jeu de données, Conjointement avec l' Classements VOA listant l'ensemble de données et le répertoire des codes postaux de l'Office of National Statistics (ONSPD).

Les données Airbnb proviennent du À l'intérieur d'Airbnb domaine, qui ne comprend que les logements entiers loués, excluant donc le cas d'usage initialement proposé pour Airbnb (c'est-à-dire la location ponctuelle de tout ou partie de son logement).

L'ensemble de données sur les propriétés à faible utilisation des auteurs a été complété par les informations reçues des demandes d'accès à l'information (FOI) réussies, principalement collectées pour une période projet antérieur.

Les données de base d'OCOD sont un fichier .CSV délimité par des virgules avec un bon degré de structure et un format prévisible.

Le pipeline comportait cinq étapes : étiquetage, analyse, expansion, classification et contractualisation. Au départ, toute adresse individuelle pourrait se résoudre dans la vie réelle à plusieurs propriétés imbriquées, bien que cela ne soit pas explicite dans les données fournies par le gouvernement.

Les chercheurs ont effectué un léger prétraitement syntaxique, puis ont importé les données dans programmatiques, une plate-forme conçue pour créer des ensembles de données NLP annotés sans étiquetage manuel. Ici, les entités ont été étiquetées à l'aide d'expressions régulières (Regex) pour décrire huit types d'entités nommées (voir l'image ci-dessous) :

Une fois ces étiquettes ajoutées, l'ensemble de données a été extrait sous forme de fichier JSON, les chevauchements d'étiquettes étant supprimés par de simples routines basées sur des règles.

De plus, la sortie de programmatique a été utilisée pour former un modèle prédictif pour SpaCy, soutenu par Facebook ROBERTa. Une fois débruités, les chercheurs ont créé un ensemble de comparaison de vérité terrain de 1000 observations étiquetées au hasard. Le score de précision des données non supervisées serait éventuellement évalué par rapport à cette vérité fondamentale.

L'analyse d'adresse a présenté un certain nombre de défis. Les auteurs ont attribué à chaque caractère sa propre ligne et à chaque classe d'étiquettes sa propre colonne, puis ont rétropropagé les colonnes pour générer des lignes d'adresse complètes.

Certaines adresses uniques comportant plusieurs logements distincts, il a été nécessaire d'étoffer la base de données, en subdivisant les adresses uniques en sous-propriétés présentes dans des bases de données complémentaires.

Après cela, l'étape de classification des adresses a recoupé tous les codes postaux localisés à l'aide de la base de données ONSPD. Ce processus connecte les données d'adresse au recensement et à d'autres données démographiques, et identifie également les sous-propriétés qui étaient auparavant cachées derrière les adresses opaques des données OCOD.

Enfin, le processus de contraction des adresses a filtré toutes les propriétés non domestiques (c'est-à-dire les locaux commerciaux) des groupes de propriétés imbriqués.

Analyse

Pour tester l'exactitude des données améliorées, les auteurs, comme mentionné précédemment, ont créé un exemple d'ensemble de vérités de terrain qui a été retenu de l'analyse générale et utilisé uniquement pour tester l'exactitude des prédictions et des analyses.

La vérification manuelle de la vérité terrain comprenait l'utilisation d'un logiciel de cartographie, ainsi que l'analyse des photos des propriétés présentées dans l'ensemble retenu et des recherches sur Internet pour évaluer le type de propriété. Par la suite, la performance des données a été mesurée par rapport à la précision, au rappel et aux scores F1.

La valeur des biens à faible usage et domestiques a été obtenue avec un modèle graphique de base, la même méthode utilisée également pour déduire les propriétés UDP.

La tâche NER, testée par rapport à la vérité terrain à effort élevé, étiquetée manuellement, a obtenu un score F1 de 0.96 (proche de « 100 % », en termes de précision).

Scores F1 pour la tâche d'étiquetage NER. Une certaine inégalité est constatée, puisque le processus surestime légèrement le nombre de propriétés domestiques et sous-estime le nombre total d'entreprises, en raison de la structure des données améliorées.

Scores F1 pour la tâche d'étiquetage NER. Une certaine inégalité est constatée, puisque le processus surestime légèrement le nombre de propriétés domestiques et sous-estime le nombre total d'entreprises, en raison de la structure des données améliorées.

En ce qui concerne les UDP à Londres, les résultats finaux montrent un total de 138,000 44 entrées, soit 94,000 % de plus que les XNUMX XNUMX figurant dans l'ensemble de données original de l'OCOD (c'est-à-dire les chiffres officiels récents).

La répartition des types de biens sous la classification de type 2.

La répartition des types de biens sous la classification de type 2.

Les résultats indiquent que la valeur totale des propriétés offshore s'élève à environ 56 milliards de livres sterling, tandis que la valeur totale des propriétés à faible utilisation est estimée à 85 milliards de livres sterling.

Les auteurs notent:

"[Tous] les UDP sont beaucoup plus chers que le prix moyen de l'immobilier conventionnel de 600 XNUMX £."

Ce type de données améliorées peut être nécessaire pour lutter contre l'utilisation de la spéculation immobilière comme activité de blanchiment d'argent au Royaume-Uni. Les auteurs notent le nombre croissant de recherches et de littérature générale qui suggèrent que des données améliorées peuvent aider à lutter contre la spéculation immobilière AML, et concluent :

"Ces données peuvent être utilisées par les sociologues, les économistes et les décideurs politiques pour s'assurer que les tentatives de réduction du blanchiment d'argent et des prix élevés de l'immobilier sont basées sur des données détaillées qui reflètent la situation réelle."

 

* Ma conversion de la citation en ligne des auteurs en hyperliens.

Première publication le 25 juillet 2022.