potongan AI Menawarkan Pelacakan Kepemilikan Properti Lepas Pantai yang Lebih Baik di Inggris - Unite.AI
Terhubung dengan kami

Kecerdasan Buatan

AI Menawarkan Pelacakan Kepemilikan Properti Lepas Pantai yang Lebih Baik di Inggris Raya

mm
Updated on

Penelitian baru dari dua universitas di Inggris bertujuan untuk menyoroti potensi pencucian uang berbasis properti di Inggris, dan khususnya di pasar real estat London yang bernilai tinggi.

Menurut hasil proyek, jumlah properti domestik 'nonkonvensional' (yaitu properti yang tidak digunakan sebagai tempat tinggal jangka panjang oleh pemilik atau penyewa) berjumlah sekitar 138,000 di London saja.

Angka ini 44% lebih tinggi dari angka resmi yang diberikan dan diperbarui secara berkala oleh pemerintah Inggris.

Para peneliti menggunakan berbagai teknik Natural Language Processing (NLP), bersama dengan data tambahan dan penelitian pendukung, untuk memperluas informasi resmi terbatas yang disediakan pemerintah Inggris mengenai persentase, nilai, lokasi, dan jenis properti yang dimiliki oleh perusahaan lepas pantai di Inggris. , yang paling menguntungkan ada di ibu kota.

Penelitian tersebut menemukan bahwa jumlah total properti lepas pantai, penggunaan rendah, dan bergaya airbnb (yaitu 'pekerjaan biasa') di Inggris secara kolektif bernilai antara £145-174 miliar GBP di sekitar 144,000-164,000 properti.

Ditemukan juga bahwa properti lepas pantai jenis ini biasanya lebih mahal dan memiliki pola khas sehubungan dengan lokasinya di Inggris.

Para peneliti memperkirakan itu milik lepas pantai Properti Domestik yang Tidak Konvensional (UDP) mewakili 7.5% dari total nilai domestik, dan £56 miliar dari nilai yang diperkirakan hanya terbatas pada 42,000 tempat tinggal.

Makalah tersebut menyatakan:

'Properti lepas pantai individu sangat mahal bahkan menurut standar UDP, selain itu mereka terkonsentrasi di pusat kota London dengan korelasi otomatis spasial yang kuat.

'Sebaliknya, properti lepas pantai bersarang agak kurang terkonsentrasi di London pusat tetapi lebih terkonsentrasi secara umum, juga hampir tidak ada korelasi spasial.'

Analisis data tambahan menunjukkan bahwa sejumlah besar properti lepas pantai milik entitas di Ketergantungan orang banyak (CD), dengan jumlah terbesar kedua dicatat oleh British Overseas Territories (pada bagan di bawah, 'PWW2' menandakan negara-negara yang memperoleh kemerdekaan dari Inggris setelah Perang Dunia Kedua).

Disposisi properti milik asing, menurut hasil dari kertas baru. Sumber: https://arxiv.org/src/2207.10931v1/anc/Offshore_London_Supplementary_Material.pdf

Disposisi properti milik asing, menurut hasil dari kertas baru. Sumber: https://arxiv.org/src/2207.10931v1/anc/Offshore_London_Supplementary_Material.pdf

Makalah ini mengamati:

'Faktanya hanya 4 wilayah, British Virgin Islands, Jersey, Guernsey dan The Isle of Man, terkait dengan 78% dari semua properti.'

Data baru yang ditingkatkan telah memungkinkan untuk menentukan sub-properti yang ada di dalam properti milik luar negeri yang diketahui – kemampuan yang biasanya terhalang oleh data yang datar dan terbatas yang diberikan dalam angka resmi.

Hasilnya juga menunjukkan bahwa properti lepas pantai, Airbnb, dan penggunaan rendah lebih terkonsentrasi secara geografis daripada rumah biasa, dan juga terkonsentrasi di area bernilai lebih tinggi.

Peta panas terkait dengan berbagai jenis properti milik luar negeri di London. Sumber: https://arxiv.org/pdf/2207.10931.pdf

Peta konsentrasi yang divisualisasikan terkait dengan berbagai jenis properti milik luar negeri di London. Sumber: https://arxiv.org/pdf/2207.10931.pdf

Dari grafik di atas, penulis berkomentar:

'Properti domestik lepas pantai memiliki konsentrasi yang sangat tinggi di mana seluruh pengembangan perumahan dimiliki oleh perusahaan lepas pantai.'

Para penulis memiliki kode yang dirilis untuk pipa pemrosesan mereka.

Grafik kertas baru berjudul Apa yang ada di binatu? Memetakan dan mengkarakterisasi properti domestik lepas pantai di London, dan berasal dari para peneliti di The Bartlett Fakultas Lingkungan Buatan di University College London, dan Departemen Ekonomi Universitas Kingston.

Mengatasi Masalah

Para penulis mencatat bahwa setelah upaya puluhan tahun untuk mengontrol penggunaan real estate untuk tujuan pencucian uang di Inggris, dibutuhkan melepaskan dari daftar bocoran properti Inggris milik lepas pantai oleh publikasi Inggris Eye Swasta pada tahun 2015 untuk mendorong pemerintah Inggris Raya menerbitkan daftar properti milik lepas pantai yang diperbarui secara berkala di sebagian besar Inggris Raya, yang dikenal sebagai Perusahaan luar negeri yang memiliki properti di Inggris dan Wales (OKOD).

Para peneliti mengamati bahwa meskipun OCOD merupakan langkah maju untuk penelitian dan analisis kepemilikan luar negeri dan potensi pencucian uang di Inggris Raya, data tersebut memiliki sejumlah keterbatasan, beberapa di antaranya sangat penting:

'Alamat ini mungkin tidak lengkap, berisi properti bersarang, di mana banyak properti ada dalam satu baris atau nomor judul, juga tidak berisi informasi apakah properti itu domestik, bisnis, atau lainnya.

'Kualitas data yang buruk seperti itu membuat pemahaman tentang distribusi dan karakteristik properti milik lepas pantai di Inggris menjadi menantang.'

Sangat sulit untuk mendapatkan data tentang properti yang disewa dengan santai seperti properti Airbnb, karena data yang tersedia untuk umum terbatas atau tidak ada. Selain itu Skotlandia (bagian dari Britania Raya) tidak membuat daftar penjualan propertinya sendiri tersedia untuk umum, tidak seperti Inggris dan Wales.

Untuk mengatasi beberapa inkonsistensi seputar klasifikasi properti, pemerintah Inggris memperkenalkan Nomor Referensi Properti Unik (UPN) sistem, dirancang untuk memungkinkan hubungan yang lebih jelas di berbagai sumber data properti. Namun, catatan penulis * 'sementara penggunaan UPRN diamanatkan, hampir tidak ada departemen pemerintah yang menggunakannya, yang berarti menghubungkan data memerlukan lanjutan pengolahan data keterampilan'.

Oleh karena itu, penelitian baru dibuat untuk membuat data lebih terperinci dan berwawasan.

Mengumpulkan dan Menghubungkan Data

Di setiap negara, format alamat biasanya dapat diprediksi dan konsisten, berlaku juga untuk alamat Inggris. Dengan demikian, dihadapkan dengan data alamat berbasis teks 'datar' (seperti yang disediakan oleh OCOD), sejumlah solusi penguraian alamat open source telah muncul untuk merujuk silang alamat ke sumber data lain.

Namun, banyak dari ini dilatih menggunakan Buka peta Jalan data, yang dapat menghasilkan alamat yang sebenarnya dapat menampung puluhan atau bahkan ratusan sub-alamat bersarang (seperti apartemen di alamat yang luas untuk blok apartemen). Akibatnya, bahkan pengurai alamat yang terkenal seperti libpostal memiliki mengalami kesulitan ketika mencoba mengurai alamat yang tidak lengkap.

Untuk membuat pengurai untuk proyek mereka, peneliti makalah baru menggunakan sejumlah kumpulan data yang tersedia untuk umum. Data kunci disediakan oleh OCOD, sedangkan komponen pembersihan data menggunakan Harga Pendaftaran Tanah kumpulan data, Bersama-sama dengan peringkat VOA daftar dataset, dan Direktori Kode Pos Kantor Statistik Nasional (ONSPD).

Data Airbnb berasal dari Di dalamAirbnb domain, yang hanya mencakup seluruh rumah yang disewakan, oleh karena itu mengecualikan kasus penggunaan awal yang diusulkan untuk Airbnb (yaitu menyewakan semua atau sebagian rumah sendiri sesekali).

Kumpulan data properti penulis yang jarang digunakan ditambah dengan informasi yang diterima dari permintaan Freedom of Information (FOI) yang berhasil, sebagian besar dikumpulkan untuk proyek sebelumnya.

Data dasar OCOD adalah file .CSV yang dibatasi koma dengan tingkat struktur yang baik dan format yang dapat diprediksi.

Pipeline terdiri dari lima tahap: pelabelan, parsing, perluasan, klasifikasi, dan kontrak. Pada awalnya, setiap alamat individu dapat menyelesaikan dalam kehidupan nyata ke beberapa properti bersarang, meskipun hal ini tidak eksplisit dalam data yang disediakan pemerintah.

Para peneliti melakukan beberapa preprocessing sintaksis ringan, lalu mengimpor data ke terprogram, sebuah platform yang dirancang untuk membuat kumpulan data NLP beranotasi tanpa pelabelan tangan. Di sini, entitas diberi label menggunakan ekspresi reguler (Regex) untuk mendeskripsikan delapan jenis entitas bernama (lihat gambar di bawah):

Dengan menambahkan label ini, kumpulan data diekstraksi sebagai file JSON, dengan tumpang tindih label dihapus oleh rutin berbasis aturan sederhana.

Selain itu, keluaran terprogram digunakan untuk melatih model prediktif untuk SpaCy, didukung oleh Facebook RobertTa. Setelah didenominasi, para peneliti membuat kumpulan perbandingan kebenaran dasar dari 1000 pengamatan yang diberi label secara acak. Skor akurasi dari data yang tidak diawasi pada akhirnya akan dievaluasi berdasarkan kebenaran dasar ini.

Penguraian alamat menyajikan sejumlah tantangan. Penulis menugaskan setiap karakter rentang barisnya sendiri dan setiap label mengklasifikasikan kolomnya sendiri, lalu mem-backpropagated kolom tersebut untuk menghasilkan baris alamat yang lengkap.

Karena beberapa alamat tunggal menampilkan beberapa tempat tinggal yang berbeda, basis data perlu diperluas, dengan membagi alamat tunggal menjadi sub-properti yang ada dalam basis data pelengkap.

Setelah itu, tahap klasifikasi alamat merujuk silang semua kode pos yang terletak menggunakan database ONSPD. Ini proses menghubungkan data alamat ke sensus dan data demografis lainnya, dan juga memisahkan sub-properti yang sebelumnya tersembunyi di balik alamat buram data OCOD.

Terakhir, proses penyusutan alamat menyaring semua properti non-domestik (yaitu bangunan komersial) dari grup properti bersarang.

Analisis

Untuk menguji keakuratan data yang ditingkatkan, penulis, seperti yang disebutkan sebelumnya, membuat kumpulan sampel kebenaran dasar yang ditahan dari analisis umum, dan hanya digunakan untuk menguji keakuratan prediksi dan analisis.

Pengecekan manual untuk kebenaran dasar termasuk penggunaan perangkat lunak peta, serta analisis gambar properti yang ditampilkan di set yang ditahan, dan pencarian internet untuk mengevaluasi jenis properti. Setelah itu, performa data diukur terhadap skor presisi, daya ingat, dan F1.

Nilai penggunaan rendah dan properti domestik diperoleh dengan model grafis dasar, metode yang sama juga digunakan untuk menyimpulkan properti UDP.

Tugas NER, yang diuji dengan upaya tinggi, kebenaran lapangan yang diberi label secara manual, memperoleh skor F1 0.96 (mendekati '100%', dalam hal akurasi).

Skor F1 untuk tugas pelabelan NER. Beberapa ketidakrataan ditemukan, karena prosesnya sedikit melebih-lebihkan jumlah properti domestik dan meremehkan jumlah total bisnis, karena struktur data yang ditingkatkan.

Skor F1 untuk tugas pelabelan NER. Beberapa ketidakrataan ditemukan, karena prosesnya sedikit melebih-lebihkan jumlah properti domestik dan meremehkan jumlah total bisnis, karena struktur data yang ditingkatkan.

Mengenai UDP di London, hasil akhir menunjukkan total 138,000 entri – 44% lebih banyak dari 94,000 yang ditampilkan dalam kumpulan data OCOD asli (yaitu, angka resmi terkini).

Rincian jenis properti di bawah klasifikasi tipe 2.

Rincian jenis properti di bawah klasifikasi tipe 2.

Hasilnya menunjukkan bahwa nilai total properti lepas pantai mencapai sekitar £56 miliar, sedangkan nilai total properti penggunaan rendah diperkirakan mencapai £85 miliar.

Catatan penulis:

'[Semua] UDP jauh lebih mahal daripada rata-rata harga properti konvensional sebesar £600 ribu.'

Peningkatan data semacam ini mungkin diperlukan untuk memerangi penggunaan spekulasi properti sebagai aktivitas pencucian uang di Inggris. Para penulis mencatat semakin banyak penelitian dan literatur umum yang menyarankan peningkatan data dapat membantu memerangi spekulasi properti AML, dan menyimpulkan:

'Data ini dapat digunakan oleh sosiolog, ekonom, dan pembuat kebijakan untuk memastikan bahwa upaya untuk mengurangi pencucian uang dan harga properti yang tinggi didasarkan pada data terperinci yang mencerminkan situasi sebenarnya.'

 

* Konversi saya dari kutipan sebaris penulis ke hyperlink.

Pertama kali diterbitkan 25 Juli 2022.