Inteligencia Artificial
AI ofrece un seguimiento mejorado de la propiedad de propiedades en alta mar en el Reino Unido

Una nueva investigación de dos universidades del Reino Unido tiene como objetivo arrojar una mayor luz sobre el estado potencial del lavado de dinero basado en la propiedad en el Reino Unido, y especialmente en el mercado inmobiliario de Londres, que es muy apreciado.
Según los resultados del proyecto, el número total de viviendas no convencionales (es decir, viviendas que no se utilizan a largo plazo ni como vivienda ni por propietarios ni inquilinos) asciende a unas 138,000 sólo en Londres.
Esta cifra es un 44 % superior a las cifras oficiales, que proporciona y actualiza periódicamente el gobierno del Reino Unido.
Los investigadores utilizaron varias técnicas de procesamiento del lenguaje natural (PNL), junto con datos adicionales e investigaciones corroborativas, para ampliar la limitada información oficial que el gobierno del Reino Unido pone a disposición sobre el porcentaje, el valor, la ubicación y los tipos de propiedades propiedad de empresas extraterritoriales en el Reino Unido. , las más lucrativas de las cuales se encuentran en la capital.
La investigación encontró que la cantidad total de propiedades offshore, de bajo uso y estilo Airbnb (es decir, 'ocupación ocasional') en el Reino Unido tienen un valor colectivo de entre £145 y £174 mil millones en aproximadamente 144,000 a 164,000 propiedades.
También descubrió que las propiedades offshore de este tipo suelen ser más caras y tienen patrones característicos en relación a dónde están ubicadas en el Reino Unido.
Los investigadores estiman que las empresas de propiedad offshore Propiedad Doméstica No Convencional (UDP) representa el 7.5% del valor doméstico total, y que 56 millones de libras esterlinas del valor estimado se limita a tan solo 42,000 viviendas.
El documento dice:
'Las propiedades offshore individuales son muy caras incluso para los estándares de UDP, además se concentran en el centro de Londres con una fuerte correlación espacial automática.
'Por el contrario, las propiedades offshore anidadas están algo menos concentradas en el centro de Londres, pero más concentradas en general; además, casi no hay correlación espacial'.
El análisis de los datos aumentados muestra que un gran número de propiedades en alta mar pertenecen a entidades en el Dependencias de la multitud (CD), y el segundo mayor número corresponde a los Territorios Británicos de Ultramar (en el gráfico a continuación, 'PWW2' significa países que obtuvieron su independencia de Gran Bretaña después de la Segunda Guerra Mundial).

Enajenación de bienes de propiedad extranjera, según los resultados del nuevo documento. Fuente: https://arxiv.org/src/2207.10931v1/anc/Offshore_London_Supplementary_Material.pdf
El documento observa:
'De hecho, sólo cuatro territorios (Islas Vírgenes Británicas, Jersey, Guernsey y la Isla de Man) están asociados con el 4% de todas las propiedades.'
Los nuevos datos mejorados han hecho posible determinar las subpropiedades que existen dentro de una propiedad de propiedad extranjera conocida, una capacidad que generalmente se ve obstaculizada por los datos planos y limitados proporcionados en las cifras oficiales.
Los resultados también indican que las propiedades offshore, Airbnb y de bajo uso están notablemente más concentradas geográficamente que las casas normales y, además, se concentran en áreas de mayor valor.

Mapas de concentración visualizados relacionados con varios tipos de propiedades de propiedad extranjera en Londres. Fuente: https://arxiv.org/pdf/2207.10931.pdf
Del gráfico anterior, los autores comentan:
'Las propiedades domésticas en el exterior presentan concentraciones extremadamente altas, donde todo un complejo de viviendas es propiedad de una empresa extraterritorial'.
Los autores tienen código liberado para su tubería de procesamiento.
El nuevo documento se titula ¿Qué hay en la lavandería? Mapeo y caracterización de propiedades residenciales en el extranjero en Londres., y proviene de investigadores de la Facultad Bartlett de Entorno Construido del University College de Londres y del Departamento de Economía de la Universidad de Kingston.
Abordar el problema
Los autores señalan que después de décadas de esfuerzos para controlar el uso de bienes raíces para fines de lavado de dinero en el Reino Unido, tomó la , de una lista filtrada de propiedades del Reino Unido en alta mar por la publicación británica Detective en 2015 para alentar al gobierno del Reino Unido a publicar una lista actualizada periódicamente de propiedades en alta mar en la mayor parte del Reino Unido, conocida como Empresas extranjeras que poseen propiedades en Inglaterra y Gales (OCOD).
Los investigadores observan que aunque OCOD es un paso adelante en la investigación y el análisis de la propiedad extranjera y el posible lavado de dinero en el Reino Unido, los datos tienen una serie de limitaciones, algunas de ellas cruciales:
'Estas direcciones pueden estar incompletas, contener propiedades anidadas, donde existen múltiples propiedades dentro de una sola fila o número de título, tampoco contiene información sobre si la propiedad es doméstica, comercial u otra cosa.
“Estos datos de tan baja calidad hacen que resulte complicado comprender la distribución y las características de las propiedades en alta mar en el Reino Unido”.
Es particularmente difícil obtener datos sobre propiedades alquiladas ocasionalmente, como las propiedades de Airbnb, ya que los datos disponibles públicamente son limitados o inexistentes. Además, Escocia (una parte del Reino Unido) no pone a disposición del público su propio registro de ventas de propiedades, a diferencia de Inglaterra y Gales.
Para contrarrestar algunas de las inconsistencias en torno a la clasificación de propiedades, el gobierno del Reino Unido introdujo el Número de referencia de propiedad único (UPRN), diseñado para permitir relaciones más claras entre diversas fuentes de datos de propiedad. Sin embargo, los autores señalan* 'si bien el uso de UPRN es obligatorio, casi ningún departamento del gobierno lo usa, lo que significa que vincular los datos requiere proceso de datos habilidades".
Por lo tanto, la nueva investigación se propuso hacer que los datos fueran más granulares y perspicaces.
Recopilación y conexión de los datos
Dentro de cada país, los formatos de dirección suelen ser predecibles y consistentes, aplicables también a las direcciones del Reino Unido. Por lo tanto, ante los datos de direcciones "planos" basados en texto (como los proporcionados por OCOD), han surgido diversas soluciones de código abierto para el análisis de direcciones que permiten comparar las direcciones con otras fuentes de datos.
Sin embargo, muchos de estos están entrenados usando Abrir mapa de calles datos, que pueden generar direcciones que en realidad pueden albergar decenas o incluso cientos de subdirecciones anidadas (como apartamentos en una dirección amplia para un bloque de apartamentos). En consecuencia, incluso un analizador de direcciones aclamado como libretapostal tiene tuvo dificultad al intentar analizar direcciones incompletas.
Para crear el analizador para su proyecto, los investigadores del nuevo artículo utilizaron varios conjuntos de datos públicos. Los datos clave fueron proporcionados por OCOD, mientras que el componente de depuración de datos utilizó el Precio del Registro de la Propiedad. datos, Junto con el Calificaciones de VOA conjunto de datos de listado y el directorio de códigos postales de la Oficina Nacional de Estadísticas (ONSPD).
Los datos de Airbnb provienen de la InteriorAirbnb dominio, que sólo incluye casas enteras que se alquilan, excluyendo así el caso de uso propuesto originalmente para Airbnb (es decir, alquilar la totalidad o parte de la propia casa de manera ocasional).
El conjunto de datos de propiedades de bajo uso de los autores se complementó con información recibida de solicitudes exitosas de Libertad de Información (FOI), recopiladas principalmente para un proyecto anterior.
La base de datos de OCOD es un archivo .CSV delimitado por comas con un buen grado de estructura y formato predecible.
La canalización constaba de cinco etapas: etiquetado, análisis, expansión, clasificación y contratación. Al principio, cualquier dirección individual podría resolverse en la vida real en múltiples propiedades anidadas, aunque esto no está explícito en los datos proporcionados por el gobierno.
Los investigadores realizaron un preprocesamiento sintáctico ligero, luego importaron los datos a programático, una plataforma diseñada para crear conjuntos de datos NLP anotados sin etiquetado manual. Aquí, las entidades se etiquetaron usando expresiones regulares (Regex) para describir ocho tipos de entidades nombradas (ver imagen a continuación):
Con estas etiquetas agregadas, el conjunto de datos se extrajo como un archivo JSON, y las superposiciones de etiquetas se eliminaron mediante rutinas simples basadas en reglas.
Además, la salida programática se utilizó para entrenar un modelo predictivo para ESPACIO, respaldado por Facebook roberta. Una vez eliminado el ruido, los investigadores crearon un conjunto de comparación de la verdad del terreno de 1000 observaciones etiquetadas al azar. El puntaje de precisión de los datos no supervisados eventualmente se evaluaría contra esta verdad básica.
El análisis de direcciones presentó una serie de desafíos. Los autores asignaron a cada intervalo de caracteres su propia fila ya cada clase de etiqueta su propia columna, y luego propagaron las columnas hacia atrás para generar filas de direcciones completas.
Dado que algunas direcciones únicas presentaban múltiples viviendas distintas, fue necesario ampliar la base de datos, subdividiendo las direcciones únicas en subpropiedades presentes en bases de datos complementarias.
Después de esto, la etapa de clasificación de direcciones cruzó todos los códigos postales ubicados utilizando la base de datos ONSPD. Este conecta los datos de dirección con el censo y otros datos demográficos, y también individualiza las subpropiedades que previamente se habían ocultado detrás de las direcciones opacas de los datos OCOD.
Finalmente, el proceso de contracción de direcciones filtró todas las propiedades no domésticas (es decir, locales comerciales) de los grupos de propiedades anidadas.
Analisis
Para probar la precisión de los datos mejorados, los autores, como se mencionó anteriormente, crearon un conjunto de verdad de campo de muestra que se retuvo de la ejecución general del análisis y se usó solo para probar la precisión de las predicciones y los análisis.
La verificación manual de la verdad del terreno incluyó el uso de software de mapas, así como el análisis de imágenes de las propiedades que aparecen en el conjunto retenido y búsquedas en Internet para evaluar el tipo de propiedad. A partir de entonces, el rendimiento de los datos se midió frente a las puntuaciones de precisión, recuperación y F1.
El valor de la propiedad doméstica y de bajo uso se obtuvo con un modelo gráfico básico, el mismo método utilizado también para inferir las propiedades UDP.
La tarea NER, probada contra la verdad fundamental etiquetada manualmente y de alto esfuerzo, obtuvo una puntuación F1 de 0.96 (cerca del «100 %» en términos de precisión).

Puntuaciones F1 para la tarea de etiquetado NER. Se encuentra cierta irregularidad, ya que el proceso sobreestima levemente el número de propiedades domésticas y subestima el número total de empresas, debido a la estructura de los datos mejorados.
Con respecto a los UDP en Londres, los resultados finales muestran un total de 138,000 44 entradas, un 94,000 % más que las XNUMX XNUMX que aparecen en el conjunto de datos OCOD original (es decir, cifras oficiales recientes).

El desglose de los tipos de propiedad bajo la clasificación de tipo 2.
Los resultados indican que el valor total de las propiedades en alta mar ronda los 56 85 millones de libras esterlinas, mientras que el valor total de las propiedades de bajo uso se estima en XNUMX XNUMX millones de libras esterlinas.
Los autores señalan:
'Todos los UDP son mucho más caros que el precio medio de la propiedad convencional, de 600 libras esterlinas'.
Este tipo de datos mejorados puede ser necesario para combatir el uso de la especulación inmobiliaria como actividad de lavado de dinero en el Reino Unido. Los autores señalan el creciente cuerpo de investigación y literatura general que sugiere que los datos mejorados pueden ayudar a combatir la especulación de propiedades AML y concluyen:
'Estos datos pueden ser utilizados por sociólogos, economistas y responsables políticos para garantizar que los intentos de reducir el lavado de dinero y los altos precios de las propiedades se basen en datos detallados que reflejen la situación real.'
* Mi conversión de las citas en línea de los autores a hipervínculos.
Publicado por primera vez el 25 de julio de 2022.