toco AI oferece rastreamento aprimorado de propriedade offshore no Reino Unido - Unite.AI
Entre em contato

Inteligência artificial

AI oferece rastreamento aprimorado de propriedade offshore no Reino Unido

mm
Atualização do on

Uma nova pesquisa de duas universidades do Reino Unido visa lançar uma luz maior sobre o estado potencial da lavagem de dinheiro baseada em propriedade no Reino Unido e, especialmente, no altamente valorizado mercado imobiliário de Londres.

De acordo com os resultados do projeto, o número total de propriedades domésticas 'não convencionais' (ou seja, propriedades que não são usadas a longo prazo como residências por proprietários ou locatários) é de cerca de 138,000 somente em Londres.

Este valor é 44% superior aos números oficiais, que são fornecidos e atualizados periodicamente pelo governo do Reino Unido.

Os investigadores utilizaram várias técnicas de Processamento de Linguagem Natural (PNL), juntamente com dados adicionais e pesquisas corroborativas, para ampliar a informação oficial limitada que o governo do Reino Unido disponibiliza sobre a percentagem, valor, localização e tipos de propriedade pertencentes a empresas offshore no Reino Unido. , dos quais os mais lucrativos estão na capital.

A pesquisa descobriu que a quantidade total de propriedades offshore, de baixo uso e estilo airbnb (ou seja, 'ocupação casual') no Reino Unido valem coletivamente algo entre £ 145-174 bilhões de libras esterlinas em aproximadamente 144,000-164,000 propriedades.

Ele também descobriu que as propriedades offshore desse tipo são normalmente mais caras e têm padrões de assinatura em relação à sua localização no Reino Unido.

Os pesquisadores estimam que as empresas offshore Propriedade Doméstica Não Convencional (UDP) representa 7.5% do valor doméstico total, e que £ 56 bilhões do valor estimado se limita a apenas 42,000 habitações.

O artigo afirma:

'Propriedades offshore individuais são muito caras, mesmo para os padrões da UDP, além disso, estão concentradas no centro de Londres com forte autocorrelação espacial.

'Em contraste, a propriedade offshore aninhada é um pouco menos concentrada no centro de Londres, mas mais altamente concentrada em geral, também quase não há correlação espacial.'

A análise dos dados aumentados mostra que um grande número de propriedades offshore pertencem a entidades no dependências de multidão (CD), com o segundo maior número representado pelos Territórios Ultramarinos Britânicos (no gráfico abaixo, 'PWW2' significa países que obtiveram independência da Grã-Bretanha após a Segunda Guerra Mundial).

Alienação de propriedade de propriedade estrangeira, de acordo com os resultados do novo papel. Fonte: https://arxiv.org/src/2207.10931v1/anc/Offshore_London_Supplementary_Material.pdf

Alienação de propriedade de propriedade estrangeira, de acordo com os resultados do novo papel. Fonte: https://arxiv.org/src/2207.10931v1/anc/Offshore_London_Supplementary_Material.pdf

O jornal observa:

'Na verdade, apenas 4 territórios, Ilhas Virgens Britânicas, Jersey, Guernsey e Ilha de Man, estão associados a 78% de todas as propriedades.'

Os novos dados aprimorados tornaram possível determinar subpropriedades que existem dentro de uma propriedade conhecida de propriedade no exterior – uma capacidade geralmente prejudicada pelos dados simples e limitados fornecidos nos números oficiais.

Os resultados também indicam que propriedades offshore, Airbnb e de baixo uso são notavelmente mais concentradas geograficamente do que residências normais e, adicionalmente, concentradas em áreas de maior valor.

Mapas de calor relacionados a vários tipos de propriedades estrangeiras em Londres. Fonte: https://arxiv.org/pdf/2207.10931.pdf

Mapas de concentração visualizados relacionados a vários tipos de propriedades estrangeiras em Londres. Fonte: https://arxiv.org/pdf/2207.10931.pdf

Sobre o gráfico acima, os autores comentam:

'A propriedade doméstica offshore tem algumas concentrações extremamente altas, onde todo um conjunto habitacional é propriedade de uma empresa offshore.'

Os autores têm código liberado para seu pipeline de processamento.

A novo papel é intitulado O que tem na lavanderia? Mapeamento e caracterização de propriedade doméstica offshore em Londres, e vem de pesquisadores da The Bartlett Faculty of the Built Environment na University College London e do Departamento de Economia da Kingston University.

Abordando o problema

Os autores observam que, após décadas de esforços para controlar o uso de imóveis para fins de lavagem de dinheiro no Reino Unido, foi necessário o liberar de uma lista vazada de propriedades britânicas de propriedade offshore pela publicação britânica Private Eye em 2015 para estimular o governo do Reino Unido a publicar uma lista regularmente atualizada de propriedades offshore na maior parte do Reino Unido, conhecida como Empresas estrangeiras que possuem propriedades na Inglaterra e no País de Gales (TOC).

Os pesquisadores observam que, embora o OCOD seja um passo à frente na pesquisa e análise de propriedade no exterior e possível lavagem de dinheiro no Reino Unido, os dados têm várias limitações, algumas delas cruciais:

'Esses endereços podem estar incompletos, conter propriedades aninhadas, onde existem várias propriedades em uma única linha ou número de título, também não contém informações sobre se a propriedade é doméstica, comercial ou outra coisa.

'Esses dados de baixa qualidade dificultam a compreensão da distribuição e das características da propriedade offshore no Reino Unido.'

É particularmente difícil obter dados sobre propriedades alugadas casualmente, como propriedades do Airbnb, uma vez que os dados disponíveis publicamente são limitados ou inexistentes. Além disso, a Escócia (uma parte do Reino Unido) não disponibiliza publicamente seu próprio registro de vendas de propriedades, ao contrário da Inglaterra e do País de Gales.

Para combater algumas das inconsistências em torno da classificação da propriedade, o governo do Reino Unido introduziu o Número de referência exclusivo da propriedade (UPRN), projetado para permitir relacionamentos mais claros em diversas fontes de dados de propriedade. No entanto, os autores observam* 'embora o uso do UPRN seja obrigatório, quase nenhum departamento do governo o usa, o que significa que vincular os dados requer recursos avançados informática Habilidades'.

Assim, a nova pesquisa se propôs a tornar os dados mais granulares e perspicazes.

Coletando e conectando os dados

Dentro de qualquer país, os formatos de endereço geralmente são previsíveis e consistentes, aplicáveis ​​também aos endereços do Reino Unido. Assim, diante de dados endereçados baseados em texto 'planos' (como os fornecidos pelo OCOD), várias soluções de análise de endereços de código aberto surgiram para endereços de referência cruzada com outras fontes de dados.

No entanto, muitos deles são treinados usando Abrir mapa de ruas dados, que podem gerar endereços que podem realmente hospedar dezenas ou até centenas de subendereços aninhados (como apartamentos em um endereço de amplo alcance para um bloco de apartamentos). Conseqüentemente, mesmo um analisador de endereços aclamado, como libpostal tem teve dificuldade ao tentar analisar endereços incompletos.

Para criar o analisador para seu projeto, os pesquisadores do novo artigo usaram vários conjuntos de dados disponíveis publicamente. Os dados principais foram fornecidos pelo OCOD, enquanto o componente de limpeza de dados usou o Preço do Registro Predial conjunto de dados, Juntamente com o classificações VOA conjunto de dados de listagem e o Diretório de Código Postal do Escritório de Estatísticas Nacionais (ONSPD).

Os dados do Airbnb vieram do Por dentro do Airbnb domínio, que inclui apenas casas inteiras que são alugadas, excluindo, portanto, o caso de uso original proposto para o Airbnb (ou seja, alugar toda ou parte da própria casa ocasionalmente).

O conjunto de dados de propriedade de baixo uso dos autores foi aumentado por informações recebidas de solicitações bem-sucedidas de Liberdade de Informação (FOI), coletadas principalmente para um projeto anterior.

A base de dados do OCOD é um arquivo .CSV delimitado por vírgula com um bom grau de estrutura e formato previsível.

O pipeline consistia em cinco estágios: rotulagem, análise, expansão, classificação e contratação. No início, qualquer endereço individual poderia resultar na vida real em várias propriedades aninhadas, embora isso não esteja explícito nos dados fornecidos pelo governo.

Os pesquisadores realizaram um leve pré-processamento sintático e depois importaram os dados para Programático, uma plataforma projetada para criar conjuntos de dados NLP anotados sem rotulagem manual. Aqui, as entidades foram rotuladas usando expressões regulares (Regex) para descrever oito tipos de entidades nomeadas (veja a imagem abaixo):

Com esses rótulos adicionados, o conjunto de dados foi extraído como um arquivo JSON, com as sobreposições de rótulo removidas por rotinas simples baseadas em regras.

Além disso, a saída programática foi usada para treinar um modelo preditivo para SpaCy, sustentado pelo Facebook Roberto. Uma vez eliminados, os pesquisadores criaram um conjunto de comparação de 1000 observações rotuladas aleatoriamente. A pontuação de precisão dos dados não supervisionados acabaria sendo avaliada em relação a essa verdade básica.

A análise de endereços apresentou uma série de desafios. Os autores atribuídos a cada caractere abrangem sua própria linha e cada classe de rótulo sua própria coluna e, em seguida, retropropagam as colunas para gerar linhas de endereço completas.

Como alguns endereços únicos apresentavam múltiplas residências distintas, foi necessário ampliar o banco de dados, subdividindo endereços únicos em subpropriedades presentes em bancos de dados complementares.

Depois disso, a etapa de classificação de endereços cruzou todos os códigos postais localizados usando o banco de dados ONSPD. Esse processo conecta os dados de endereço ao censo e outros dados demográficos e também individualiza subpropriedades que anteriormente estavam ocultas atrás dos endereços opacos dos dados OCOD.

Por fim, o processo de contração de endereço filtrou todas as propriedades não domésticas (ou seja, instalações comerciais) de grupos de propriedades aninhadas.

Análise

Para testar a precisão dos dados aprimorados, os autores, conforme mencionado anteriormente, criaram um conjunto de dados de campo de amostra que foi retido na execução geral da análise e usado apenas para testar a precisão das previsões e análises.

A verificação manual da verdade de campo incluiu o uso de software de mapas, bem como a análise de fotos das propriedades apresentadas no conjunto retido e de pesquisas na Internet para avaliar o tipo de propriedade. Depois disso, o desempenho dos dados foi medido em relação aos escores de precisão, recordação e F1.

O valor da propriedade doméstica e de baixo uso foi obtido com um modelo gráfico básico, o mesmo método usado também para inferir propriedades UDP.

A tarefa NER, testada contra a verdade de campo rotulada manualmente de alto esforço, obteve uma pontuação F1 de 0.96 (próximo de '100%', em termos de precisão).

Pontuações F1 para a tarefa de rotulagem NER. Algumas desigualdades são encontradas, uma vez que o processo superestima ligeiramente o número de propriedades domésticas e subestima o número total de empresas, devido à estrutura dos dados aprimorados.

Pontuações F1 para a tarefa de rotulagem NER. Algumas desigualdades são encontradas, uma vez que o processo superestima ligeiramente o número de propriedades domésticas e subestima o número total de empresas, devido à estrutura dos dados aprimorados.

Em relação aos UDPs em Londres, os resultados finais mostram um total de 138,000 entradas – 44% a mais do que os 94,000 apresentados no conjunto de dados OCOD original (ou seja, números oficiais recentes).

A repartição dos tipos de propriedade sob a classificação do tipo 2.

A repartição dos tipos de propriedade sob a classificação do tipo 2.

Os resultados indicam que o valor total das propriedades offshore é de cerca de £ 56 bilhões, enquanto o valor total das propriedades de baixo uso é estimado em £ 85 bilhões.

Os autores observam:

'[Todos] os UDPs são muito mais caros do que o preço médio da propriedade convencional de £ 600 mil.'

Esse tipo de dados aprimorados pode ser necessário para combater o uso da especulação imobiliária como atividade de lavagem de dinheiro no Reino Unido. Os autores observam o crescente corpo de pesquisa e literatura geral que sugere que dados aprimorados podem ajudar no combate à especulação imobiliária AML e concluem:

'Esses dados podem ser usados ​​por sociólogos, economistas e formuladores de políticas para garantir que as tentativas de reduzir a lavagem de dinheiro e os altos preços dos imóveis sejam baseadas em dados detalhados que reflitam a situação real.'

 

* Minha conversão da citação inline dos autores em hiperlinks.

Publicado pela primeira vez em 25 de julho de 2022.