Yapay Zekâ

AI, İngiltere’de Deniz Ötesi Mülk Sahipliğinin İzlenmesini İyileştiriyor

mm

İki İngiltere üniversitesinden yapılan yeni bir araştırmayla, Birleşik Krallık’ta, özellikle de yüksek değerli Londra gayrimenkul piyasasındaki mülk temelindeki para aklama potansiyel durumuna daha büyük bir ışık tutulması hedefleniyor.

Araştırma sonuçlarına göre, Londra’da alone ‘gayri geleneksel’ iç mülklerin (yani uzun süreli olarak sahipleri veya kiracıları tarafından kullanılan mülkler değil) toplam sayısı yaklaşık 138.000’dir.

Bu rakam, UK hükümeti tarafından sağlanan ve periyodik olarak güncellenen resmi rakamlardan %44 daha yüksektir.

Araştırmacılar, Birleşik Krallık’taki offshore şirketlerine ait mülklerin yüzdesi, değeri, konumu ve türleri hakkında UK hükümeti tarafından sağlanan sınırlı resmi bilgilere ek veri ve araştırma ile birlikte çeşitli Doğal Dil İşleme (NLP) tekniklerini kullandılar.

Araştırma, Birleşik Krallık’taki offshore, düşük kullanım ve Airbnb tarzı (yani ‘gevşek işgal’) mülklerin toplam değerinin yaklaşık 144.000-164.000 mülk üzerinden 145-174 milyar GBP arasında olduğunu gösterdi.

Ayrıca, bu tür offshore mülklerin genellikle daha pahalı olduğu ve UK’de bulundukları yere ilişkin imza kalıplarına sahip olduğu tespit edildi.

Araştırmacılar, offshore sahip olduğu Gayri Geleneksel İç Mülk (UDP)’nin toplam iç değerinin %7,5’ini temsil ettiğini ve tahmini değerinin 56 milyar sterlininin yalnızca 42.000 konuta ait olduğunu tahmin ediyorlar.

Makalede şöyle deniyor:

‘Bireysel offshore mülkler, hatta UDP standartlarına göre bile çok pahalı, ayrıca Londra merkezinde yoğunlaşmış durumda ve güçlü bir mekansal özerklik gösteriyor.’

‘Öte yandan, iç içe offshore mülkler, merkezi Londra’da biraz daha az yoğunlaşmış, ancak genel olarak daha fazla yoğunlaşmış ve neredeyse hiçbir mekansal korelasyon yok.’

Artırılmış verilerin analizi, birçok offshore mülkün Crowd Dependencies (CD) içindeki varlıklara ait olduğunu gösteriyor, ikinci en büyük sayıda mülk ise İngiliz Denizaşırı Toprakları tarafından temsil ediliyor (aşağıdaki grafikte ‘PWW2’, İngiltere’den II. Dünya Savaşı’ndan sonra bağımsızlığını kazanan ülkeleri temsil ediyor).

Yabancı sahip olunan mülkün dağılımı, yeni makalenin sonuçlarına göre.

Yabancı sahip olunan mülkün dağılımı, yeni makalenin sonuçlarına göre. Kaynak: https://arxiv.org/src/2207.10931v1/anc/Offshore_London_Supplementary_Material.pdf

Makalede şöyle deniyor:

‘Aslında, yalnızca 4 bölge, Britanya Virjin Adaları, Jersey, Guernsey ve Man Adası, tüm mülklerin %78’ine bağlı.’

Yeni artırılmış veriler, bilinen bir offshore sahip olunan mülk içinde var olan alt mülkleri belirleme olanağı sağladı – bu genellikle resmi rakamlar tarafından sağlanan düz ve sınırlı verilerle engellenen bir özellik.

Sonuçlar ayrıca, offshore, Airbnb ve düşük kullanım mülklerinin normal evlerden daha coğrafi olarak yoğunlaştırıldığını ve daha yüksek değerli alanlara yoğunlaştırıldığını gösteriyor.

Londra'da çeşitli türlerdeki yabancı sahip olunan mülklere ilişkin ısı haritaları.

Londra’da çeşitli türlerdeki yabancı sahip olunan mülklere ilişkin görselleştirilmiş konsantrasyon haritaları. Kaynak: https://arxiv.org/pdf/2207.10931.pdf

Yukarıdaki grafik hakkında yazarlar şöyle diyor:

‘Offshore iç mülk, bir bütün olarak bir konut gelişiminin offshore bir şirket tarafından sahip olunduğu çok yüksek konsantrasyonlara sahip.’

Yazarlar, işleme pipeline’leri için kodu yayınladılar.

Yeni makale, Londra’da offshore sahip olunan iç mülkün haritalanması ve karakterizasyonu başlığını taşıyor ve University College London’daki The Bartlett Faculty of the Built Environment ve Kingston University’nin Department of Economics’ten araştırmacılardan geliyor.

Sorunun Çözümü

Yazarlar, İngiltere’de gayrimenkulün para aklama amacıyla kullanılmasını kontrol etme çabalarının on yıllarca sürmesine rağmen, 2015 yılında İngiliz yayını Private Eye tarafından sızdırılan bir offshore sahip olunan UK mülk listesinin yayınlanmasının, UK hükümetini İngiltere’nin çoğunda offshore sahip olunan mülklerin düzenli olarak güncellenen bir listesini yayınlamaya ittiğini belirtiyorlar, bu liste İngiltere ve Galler’de mülk sahibi offshore şirketler (OCOD) olarak bilinir.

Araştırmacılar, OCOD’un, UK’de yabancı sahipliği ve potansiyel para aklamanın araştırılması ve analizi için bir adım olduğunu, ancak verilerin bir dizi sınırlaması olduğunu, bazılarının kritik olduğunu gözlemliyorlar:

‘Bu adresler eksik olabilir, iç içe mülkler içerebilir, yani tek bir satır veya unvan numarasında birden fazla mülk bulunabilir, ayrıca mülkün iç, ticari veya başka bir şey olup olmadığını belirten hiçbir bilgi içermez. ‘

‘Bu tür düşük kaliteli veriler, UK’de offshore sahip olunan mülkün dağılımını ve özelliklerini anlamayı zorlaştırıyor.’

Özellikle, Airbnb mülkleri gibi gevşek olarak kiralanmış mülkler hakkında veri elde etmek zor, çünkü kamu tarafından erişilebilen veriler sınırlı veya mevcut değil. Ayrıca, İngiltere’nin bir parçası olan İskoçya, İngiltere ve Galler’in yaptığı gibi kendi mülk satış kaydını kamuoyuna açık olarak yayınlamıyor.

Tüm bu tutarsızlıkları gidermek için, UK hükümeti, çeşitli mülk verisi kaynakları arasında daha net ilişkiler kurulmasını sağlayan Unique Property Reference Number (UPRN) sistemini tanıttı. Ancak yazarlar, ‘UPRN kullanımının zorunlu olmasına rağmen,几乎 hiçbir hükümet departmanı tarafından kullanılmıyor, bu da verilerin bağlanması için gelişmiş veri işleme becerileri gerektiriyor’ diyorlar.

Bu nedenle, yeni araştırma, verilerin daha granüler ve daha açık hale getirilmesini amaçladı.

Verilerin Toplanması ve Bağlanması

Herhangi bir ülkede, adres formatları genellikle öngörülebilir ve tutarlıdır, bu durum UK adresleri için de geçerlidir. Bu nedenle, ‘düz’, metin tabanlı adresli verilerle (örneğin, OCOD tarafından sağlanan veriler) karşı karşıya kalan birçok açık kaynaklı adres-parsing çözümü, adresleri diğer veri kaynaklarına çapraz başvurmak için ortaya çıktı.

Ancak, bu çözümlerden çoğu, Open Street map verilerini kullanarak eğitildi, bu da aslında onlarca veya hatta yüzlerce iç içe alt adresleri (örneğin, bir apartman bloğunun geniş bir adresindeki daireler) barındıran adresler verebilir. Dolayısıyla, libpostal gibi ünlü bir adres-parser bile, eksik adresleri ayrıştırmaya çalışırken zorluklar yaşadı.

Araştırmacılar, projelerinin parser’ini oluşturmak için birçok kamu veritabanını kullandı. Ana veri, OCOD tarafından sağlandı, mentre veri temizleme bileşeni, Land Registry Price dataset‘ini ve VOA ratings listesi veritabanını ve Office of National Statistics Postcode Directory (ONSPD)’yi kullandı.

Airbnb verisi, yalnızca tüm evlerin kiralandığı InsideAirbnb alanından geldi, bu da orijinal olarak önerilen kullanım durumunu hariç tutuyor (yani, zaman zaman tüm evin veya bir kısmının kiralanması).

Araştırmacıların düşük kullanım mülkleri verisi, büyük ölçüde daha önce bir proje için toplanan başarılı Freedom of Information (FOI) taleplerinden alınan bilgilerle zenginleştirildi.

OCOD’un temel verisi, iyi bir yapıya sahip ve öngörülebilir bir formatla .CSV virgülle ayrılmış bir dosyadır.

İşleme pipeline’ı beş aşamadan oluşuyordu: etiketleme, ayrıştıma, genişletme, sınıflandırma ve sözleşme. Başlangıçta, herhangi bir adres, gerçek hayatta birden fazla iç içe mülke karşılık gelebilirdi, ancak bu durum hükümet tarafından sağlanan verilerde açık değildir.

Araştırmacılar, bazı hafif sentaktik ön işleme gerçekleştirdiler, ardından verileri programmatic‘e ithal ettiler, bu bir platform, elle etiketleme olmadan annotated NLP veri kümeleri oluşturmak için tasarlandı. Burada, varlıklar, sekiz tür adlanan varlık (aşağıdaki resme bakınız) tanımlamak için düzenli ifadelerle (Regex) etiketlendi:

Bu etiketler eklendikten sonra, veri kümesi, etiket çakışmalarını basit kurallarla düzenlenen bir JSON dosyası olarak çıkarıldı.

Ek olarak, programmatic’in çıkışı, Facebook’ın RoBERTa‘sına dayanan SpaCy için bir预测 modeli eğitmek için kullanıldı. Gürültü giderildikten sonra, araştırmacılar, 1000 rastgele etiketlenmiş gözlemi içeren bir temel gerçeklik karşılaştırma kümesi oluşturdular. Denetimsiz verilerin doğruluk puanı sonunda bu temel gerçeklik karşılaştırmasıyla değerlendirilecekti.

Adres ayrıştıma bir dizi zorluk sundu. Yazarlar, her karakter aralığının kendi satırına ve her etiket sınıfının kendi sütununa sahip olmasını, ardından sütunları tam adres satırlarını üretmek için geri yaydılar.

Bazı tek adresler birden fazla farklı mesken içerdiğinden, veritabanını, tek adresleri tamamlayıcı veritabanlarındaki alt mülklere bölmek suretiyle genişletmek gerekli oldu.

Bundan sonra, adres sınıflandırma aşaması, ONSPD veritabanını kullanarak tüm bulunan posta kodlarını çapraz başvurdu. Bu süreç, adres verilerini nüfus ve diğer demografik verilere bağlar ve ayrıca önceden OCOD verilerinin bulanık adresleri arkasında gizlenmiş olan alt mülkleri bireyselleştirir.

Son olarak, adres sözleşme işlemi, iç içe mülk gruplarından tüm iç olmayan mülkleri (yani ticari premises) filtreledi.

Analiz

Verilerin doğruluğunu test etmek için, yazarlar, daha önce bahsedildiği gibi, genel analiz akışından geri tutulan bir örnek temel gerçeklik kümesi oluşturdular ve yalnızca tahminlerin ve analizlerin doğruluğunu test etmek için kullandılar.

Temel gerçeklik için manuel kontrol, harita yazılımlarının, mülklerin resimlerinin ve internet aramalarının analizini içeriyordu.

Daha sonra, verilerin performansı, kesinlik, geri çağırma ve F1 puanlarına karşı ölçüldü.

Düşük kullanım ve iç mülkün değeri, aynı yöntem kullanılarak, temel bir grafik modeliyle elde edildi.

NER görevi, yüksek çaba gerektiren, elle etiketlenmiş temel gerçeklik karşılaştırmasıyla test edildi ve 0,96’lık bir F1 puanı elde etti (yaklaşık ‘100%’ doğruluk).

NER etiketleme görevi için F1 puanları. Bir dengesizlik bulunur, çünkü işlem, iç mülklerin sayısını biraz fazla tahmin eder ve toplam iş sayısını düşük tahmin eder, bu da artırılmış verilerin yapısından kaynaklanır.

NER etiketleme görevi için F1 puanları. Bir dengesizlik bulunur, çünkü işlem, iç mülklerin sayısını biraz fazla tahmin eder ve toplam iş sayısını düşük tahmin eder, bu da artırılmış verilerin yapısından kaynaklanır.

Londra’daki UDP’ler hakkında, nihai sonuçlar, OCOD verisetindeki 94.000 girişin %44’ü daha fazla olan 138.000 girişi gösteriyor.

Mülk türlerinin 2. tür sınıflandırması altında ayrıştırılması.

Mülk türlerinin 2. tür sınıflandırması altında ayrıştırılması.

Sonuçlar, offshore mülklerin toplam değerinin yaklaşık 56 milyar sterlin, düşük kullanım mülklerinin toplam değerinin ise yaklaşık 85 milyar sterlin olduğunu gösteriyor.

Yazarlar, şöyle diyor:

‘[Tüm] UDP’ler, ortalama geleneksel mülk fiyatının 600.000 sterlin olduğu göz önüne alındığında, çok daha pahalı.’

Bu tür geliştirilmiş veriler, UK’de gayrimenkul spekülasyonunun para aklama faaliyeti olarak kullanılmasına karşı mücadele etmek için gerekli olabilir. Yazarlar, gelişmiş verilerin, para aklama ve yüksek mülk fiyatlarına karşı mücadele çabalarını, gerçek durumu yansıtan ayrıntılı verilerle destekleyebileceklerini belirtiyorlar ve şöyle diyorlar:

‘Bu veriler, sosyologlar, ekonomistler ve politika yapıcılar tarafından, para aklamayı azaltma ve mülk fiyatlarını düşürme çabalarının, gerçek durumu yansıtan ayrıntılı verilerle desteklenmesini sağlamak için kullanılabilir.’

 

* Yazarların inline atıfını hyperlink’e dönüştürdüm.

İlk olarak 25 Temmuz 2022’de yayımlandı.

Makine öğrenimi üzerine yazar, insan görüntü sentezinde alan uzmanı. Metaphysic.ai'de eski araştırma içeriği başkanı.
Kişisel site: martinanderson.ai
İletişim: [email protected]