Inteligencia artificial

La IA ofrece un seguimiento mejorado de la propiedad inmobiliaria en el Reino Unido

mm

Nueva investigación de dos universidades del Reino Unido tiene como objetivo arrojar más luz sobre el posible estado de la lavado de dinero basado en la propiedad en el Reino Unido, y especialmente en el mercado inmobiliario de Londres de alta valoración.

Según los resultados del proyecto, el número total de propiedades domésticas “no convencionales” (es decir, propiedades que no se utilizan a largo plazo como viviendas por propietarios o inquilinos) asciende a alrededor de 138,000 solo en Londres.

Esta cifra es un 44% más alta que las cifras oficiales, que son suministradas y actualizadas periódicamente por el gobierno del Reino Unido.

Los investigadores utilizaron varias técnicas de Procesamiento de Lenguaje Natural (NLP), junto con datos adicionales y investigación corroborativa, para ampliar la información oficial limitada que el gobierno del Reino Unido pone a disposición sobre el porcentaje, valor, ubicación y tipos de propiedades propiedad de empresas offshore en el Reino Unido, las más lucrativas de las cuales se encuentran en la capital.

La investigación encontró que la cantidad total de propiedades offshore, de bajo uso y de estilo Airbnb (es decir, “ocupación casual”) en el Reino Unido son colectivamente valoradas en algún lugar entre £145-174 mil millones de libras esterlinas en aproximadamente 144,000-164,000 propiedades.

También encontró que las propiedades offshore de este tipo suelen ser más caras y tienen patrones de firma en cuanto a dónde se encuentran en el Reino Unido.

Los investigadores estiman que la propiedad doméstica “no convencional” (UDP) propiedad de empresas offshore representa el 7,5% del valor doméstico total, y que £56 mil millones del valor estimado se limita a solo 42,000 viviendas.

El documento establece:

‘Las propiedades individuales offshore son muy caras incluso según los estándares de UDP, además están concentradas en el centro de Londres con una fuerte autocorrelación espacial.

‘En contraste, la propiedad offshore anidada es algo menos concentrada en el centro de Londres pero más altamente concentrada en general, también hay casi ninguna correlación espacial.’

El análisis de los datos aumentados muestra que un gran número de propiedades offshore pertenecen a entidades en las Dependencias de la Corona (CD), con el segundo mayor número contabilizado por los Territorios Británicos de Ultramar (en el gráfico a continuación, ‘PWW2’ significa países que obtuvieron la independencia de Gran Bretaña después de la Segunda Guerra Mundial).

Disposición de la propiedad extranjera, según los resultados del nuevo documento. Fuente: https://arxiv.org/src/2207.10931v1/anc/Offshore_London_Supplementary_Material.pdf

Disposición de la propiedad extranjera, según los resultados del nuevo documento. Fuente: https://arxiv.org/src/2207.10931v1/anc/Offshore_London_Supplementary_Material.pdf

El documento observa:

‘De hecho, solo 4 territorios, las Islas Vírgenes Británicas, Jersey, Guernsey y la Isla de Man, están asociados con el 78% de todas las propiedades.’

Los nuevos datos mejorados han hecho posible determinar subpropiedades que existen dentro de una propiedad offshore conocida – una capacidad que normalmente se ve obstaculizada por los datos planos y limitados proporcionados en las cifras oficiales.

Los resultados también indican que las propiedades offshore, Airbnb y de bajo uso son notablemente más concentradas geográficamente que los hogares normales, y además se concentran en áreas de mayor valor.

Mapas de calor relacionados con varios tipos de propiedades extranjeras en Londres. Fuente: https://arxiv.org/pdf/2207.10931.pdf

Mapas de calor visualizados relacionados con varios tipos de propiedades extranjeras en Londres. Fuente: https://arxiv.org/pdf/2207.10931.pdf

Sobre el gráfico anterior, los autores comentan:

‘La propiedad doméstica offshore tiene algunas concentraciones extremadamente altas donde un desarrollo de viviendas completo es propiedad de una empresa offshore.’

Los autores han publicado el código para su pipeline de procesamiento.

El nuevo documento se titula ¿Qué hay en la lavandería? Mapeo y caracterización de la propiedad doméstica propiedad de empresas offshore en Londres, y proviene de investigadores de la Facultad de Medio Ambiente Construido de The Bartlett en University College London, y del Departamento de Economía de la Universidad de Kingston.

Abordar el problema

Los autores señalan que después de décadas de esfuerzo para controlar el uso de la propiedad inmobiliaria con fines de lavado de dinero en el Reino Unido, se necesitó la publicación de una lista filtrada de propiedades del Reino Unido propiedad de empresas offshore por la publicación británica Private Eye en 2015 para impulsar al gobierno del Reino Unido a publicar una lista actualizada regularmente de propiedades propiedad de empresas offshore en la mayoría del Reino Unido, conocida como Empresas offshore que poseen propiedades en Inglaterra y Gales (OCOD).

Los investigadores observan que aunque OCOD es un paso adelante en la investigación y el análisis de la propiedad offshore y el posible lavado de dinero en el Reino Unido, los datos tienen una serie de limitaciones, algunas de las cuales son cruciales:

‘Estas direcciones pueden ser incompletas, contener propiedades anidadas, donde existen varias propiedades dentro de un solo número de título o fila, también no contiene información sobre si la propiedad es doméstica, comercial o algo más.

‘Estos datos de mala calidad hacen que entender la distribución y las características de la propiedad offshore en el Reino Unido sea un desafío.’

Es particularmente difícil obtener datos sobre propiedades alquiladas casualmente, como las propiedades de Airbnb, ya que los datos disponibles públicamente son limitados o no existen. Además, Escocia (parte del Reino Unido) no hace que su propio registro de ventas de propiedades esté disponible públicamente, a diferencia de Inglaterra y Gales.

Para contrarrestar algunas de las inconsistencias en torno a la clasificación de propiedades, el gobierno del Reino Unido introdujo el sistema de Número de Referencia de Propiedad Único (UPRN), diseñado para permitir relaciones más claras a través de diversas fuentes de datos de propiedades. Sin embargo, los autores señalan* ‘mientras que el uso de UPRN es obligatorio, casi ningún departamento gubernamental lo utiliza, lo que significa que vincular los datos requiere habilidades avanzadas de procesamiento de datos habilidades.

Así, la nueva investigación se propuso hacer que los datos fueran más granulares y reveladores.

Recopilar y conectar los datos

Dentro de cualquier país individual, los formatos de direcciones suelen ser predecibles y consistentes, aplicables también a las direcciones del Reino Unido. Así, enfrentados con datos de direcciones ‘planos’, basados en texto (como los proporcionados por OCOD), han surgido una serie de soluciones de análisis de direcciones de código abierto para hacer referencia a las direcciones con otras fuentes de datos.

Sin embargo, muchos de estos están entrenados utilizando Open Street map datos, que pueden producir direcciones que en realidad albergan decenas o incluso cientos de subdirecciones anidadas (como apartamentos en una dirección amplia para un bloque de apartamentos). Consecuentemente, incluso un analizador de direcciones aclamado como libpostal ha tenido dificultades al intentar analizar direcciones incompletas.

Para crear el analizador para su proyecto, los investigadores del nuevo documento utilizaron una serie de conjuntos de datos disponibles públicamente. Los datos clave fueron proporcionados por OCOD, mientras que el componente de limpieza de datos utilizó el conjunto de datos de precios de la Registro de la Tierra, junto con el conjunto de datos de calificaciones VOA, y el Directorio de Códigos Postales de la Oficina de Estadísticas Nacionales (ONSPD).

Los datos de Airbnb provinieron del dominio InsideAirbnb, que solo incluye hogares completos que se alquilan, por lo tanto excluyendo el uso original propuesto para Airbnb (es decir, alquilar todo o parte de la propia casa de manera ocasional).

El conjunto de datos de propiedades de bajo uso de los autores se amplió con información recibida de solicitudes de libertad de información (FOI) exitosas, en su mayoría recopiladas para un proyecto anterior.

La base de datos de OCOD es un archivo .CSV con delimitadores de coma con un buen grado de estructura y formato predecible.

La pipeline consistió en cinco etapas: etiquetado, análisis, expansión, clasificación y contracción. Al comienzo, cualquier dirección individual podría resolverse en la vida real en múltiples propiedades anidadas, aunque esto no es explícito en los datos gubernamentales.

Los investigadores realizaron algunos procesamientos sintácticos ligeros, luego importaron los datos a programmatic, una plataforma diseñada para crear conjuntos de datos de NLP anotados sin etiquetado manual. Aquí, las entidades se etiquetaron utilizando expresiones regulares (Regex) para describir ocho tipos de entidad con nombre (ver imagen a continuación):

Con estas etiquetas agregadas, el conjunto de datos se extrajo como un archivo JSON, con superposiciones de etiquetas eliminadas por rutinas basadas en reglas simples.

Además, la salida de programmatic se utilizó para entrenar un modelo predictivo para SpaCy, respaldado por RoBERTa de Facebook. Una vez desenoizados, los investigadores crearon un conjunto de comparación de verdad terrestre de 1000 observaciones etiquetadas aleatoriamente. La puntuación de precisión de los datos no supervisados eventualmente se evaluaría contra esta verdad terrestre.

La parsificación de direcciones presentó una serie de desafíos. Los autores asignaron a cada span de caracteres su propia fila y a cada clase de etiqueta su propia columna, y luego propagaron hacia atrás las columnas para generar filas de direcciones completas.

Dado que algunas direcciones individuales presentaban múltiples viviendas distintas, fue necesario expandir la base de datos, subdividiendo direcciones únicas en subpropiedades presentes en bases de datos complementarias.

Después de esto, la etapa de clasificación de direcciones hizo referencia a todos los códigos postales ubicados utilizando la base de datos ONSPD. Este proceso conecta los datos de direcciones con datos demográficos y censales, y también individúa subpropiedades que anteriormente estaban ocultas detrás de las direcciones opacas de los datos de OCOD.

Finalmente, el proceso de contracción de direcciones filtró todas las propiedades no domésticas (es decir, propiedades comerciales) de los grupos de propiedades anidadas.

Análisis

Para probar la precisión de los datos mejorados, los autores, como se mencionó anteriormente, crearon un conjunto de verdad terrestre de muestra que se mantuvo alejado del análisis general, y se utilizó solo para probar la precisión de las predicciones y análisis.

La verificación manual para la verdad terrestre incluyó el uso de software de mapas, así como el análisis de imágenes de las propiedades presentadas en el conjunto de muestra retenido, y de búsquedas en Internet para evaluar el tipo de propiedad. Posteriormente, el rendimiento de los datos se midió contra las puntuaciones de precisión, recuerdo y F1.

El valor de las propiedades de bajo uso y domésticas se obtuvo con un modelo gráfico básico, el mismo método utilizado también para inferir propiedades UDP.

La tarea de NER, probada contra la verdad terrestre de alto esfuerzo y etiquetada manualmente, obtuvo una puntuación F1 de 0,96 (cerca del ‘100%’, en términos de precisión).

Puntuaciones F1 para la tarea de etiquetado NER. Se encuentra algo de irregularidad, ya que el proceso sobreestima ligeramente el número de propiedades domésticas y subestima el número total de negocios, debido a la estructura de los datos mejorados.

Puntuaciones F1 para la tarea de etiquetado NER. Se encuentra algo de irregularidad, ya que el proceso sobreestima ligeramente el número de propiedades domésticas y subestima el número total de negocios, debido a la estructura de los datos mejorados.

En cuanto a las UDP en Londres, los resultados finales muestran un total de 138,000 entradas – un 44% más que las 94,000 presentadas en el conjunto de datos original de OCOD (es decir, las cifras oficiales recientes).

Desglose de los tipos de propiedades bajo la clasificación de tipo 2.

Desglose de los tipos de propiedades bajo la clasificación de tipo 2.

Los resultados indican que el valor total de las propiedades offshore asciende a alrededor de £56 mil millones, mientras que el valor total de las propiedades de bajo uso se estima en £85 mil millones.

Los autores señalan:

‘[Todas] las UDP son mucho más caras que el precio medio de la propiedad convencional de £600 mil.’

Este tipo de datos mejorados puede ser necesario para combatir el uso de la especulación inmobiliaria como una actividad de lavado de dinero en el Reino Unido. Los autores señalan el creciente cuerpo de investigación y literatura en general que sugiere que los datos mejorados pueden ayudar a combatir la especulación de la propiedad AML, y concluyen:

‘Estos datos pueden ser utilizados por sociólogos, economistas y formuladores de políticas para garantizar que los intentos de reducir el lavado de dinero y los altos precios de la propiedad se basen en datos detallados que reflejen la situación real.’

 

* Mi conversión de la cita en línea de los autores a enlaces.

Publicado por primera vez el 25 de julio de 2022.

Escritor sobre aprendizaje automático, especialista en síntesis de imágenes humanas. Anterior jefe de contenido de investigación en Metaphysic.ai.