рдХреГрддреНрд░рд┐рдо рдмреБрджреНрдзрд┐рдорддреНрддрд╛
рдпреВрдХреЗ рдореЗрдВ рдЕрдкрддрдЯреАрдп рд╕рдВрдкрддреНрддрд┐ рд╕реНрд╡рд╛рдорд┐рддреНрд╡ рдХреА рдмреЗрд╣рддрд░ рдЯреНрд░реИрдХрд┐рдВрдЧ рдХреЗ рд▓рд┐рдП рдПрдЖрдИ рдХреА рдкреЗрд╢рдХрд╢

दो यूके विश्वविद्यालयों से नए शोध का उद्देश्य संयुक्त王国, विशेष रूप से उच्च मूल्य वाले लंदन रियल एस्टेट बाजार में संपत्ति-आधारित मनी लॉन्डरिंग की संभावित स्थिति पर अधिक प्रकाश डालना है।
शोध के परिणामों के अनुसार, लंदन में ‘असामान्य’ घरेलू संपत्तियों (अर्थात संपत्तियां जो मालिकों या किरायेदारों द्वारा लंबे समय तक निवास के रूप में उपयोग नहीं की जाती हैं) की कुल संख्या लगभग 138,000 है।
यह आंकड़ा यूके सरकार द्वारा उपलब्ध कराए गए और समय-समय पर अद्यतन किए गए आधिकारिक आंकड़ों से 44% अधिक है।
शोधकर्ताओं ने विभिन्न प्राकृतिक भाषा प्रसंस्करण (एनएलपी) तकनीकों का उपयोग किया, साथ ही अतिरिक्त डेटा और पुष्टि करने वाले शोध के साथ, यूके में अपतटीय कंपनियों द्वारा स्वामित्व वाली संपत्ति के प्रतिशत, मूल्य, स्थान और प्रकार के बारे में यूके सरकार द्वारा उपलब्ध कराए गए सीमित आधिकारिक जानकारी को बढ़ाने के लिए।
शोध में पाया गया कि यूके में अपतटीय, कम उपयोग और एयरबीएनबी-शैली (अर्थात ‘अनौपचारिक कब्जे’) संपत्तियों की कुल संख्या लगभग 144,000-164,000 संपत्तियों में £145-174 बिलियन जीपीबी के बीच है।
इसने यह भी पाया कि अपतटीय संपत्तियों का यह प्रकार आमतौर पर अधिक महंगा होता है और यूके में उनके स्थान के संबंध में विशिष्ट पैटर्न होते हैं।
शोधकर्ताओं का अनुमान है कि अपतटीय-स्वामित्व वाली असामान्य घरेलू संपत्ति (यूडीपी) कुल घरेलू मूल्य का 7.5% प्रतिनिधित्व करती है, और अनुमानित मूल्य का £56 बिलियन केवल 42,000 आवासों तक सीमित है।
लेख में कहा गया है:
‘व्यक्तिगत अपतटीय संपत्तियां बहुत महंगी हैं यहां तक कि यूडीपी के मानकों द्वारा भी, इसके अलावा वे लंदन के केंद्र में केंद्रित हैं जिसमें मजबूत स्थानिक स्व-संबंध है।
‘इसके विपरीत, नेस्टेड अपतटीय संपत्ति केंद्रीय लंदन पर कम केंद्रित है लेकिन一般 में अधिक केंद्रित है, और इसमें लगभग कोई स्थानिक संबंध नहीं है।’
विस्तृत डेटा के विश्लेषण से पता चलता है कि अपतटीय संपत्तियों की एक बड़ी संख्या क्राउन डिपेंडेंसीज (सीडी) में संस्थाओं की है, जबकि दूसरी सबसे बड़ी संख्या ब्रिटिश ओवरसीज टेरिटोरीज (चार्ट में ‘पीडब्ल्यूडब्ल्यू2’ उन देशों को दर्शाता है जिन्होंने द्वितीय विश्व युद्ध के बाद ब्रिटेन से स्वतंत्रता प्राप्त की थी) के लिए जिम्मेदार है।
[कैप्शन id=”attachment_182748″ align=”alignnone” width=”543″]
लेख में कहा गया है:
‘वास्तव में, केवल 4 क्षेत्र, ब्रिटिश वर्जिन आइलैंड्स, जर्सी, गुएर्नसे और आइल ऑफ मैन, सभी संपत्तियों के 78% से जुड़े हुए हैं।’
नई विस्तृत डेटा ने ज्ञात अपतटीय-स्वामित्व वाली संपत्ति के भीतर उप-संपत्तियों का निर्धारण करना संभव बना दिया है – एक क्षमता जो आमतौर पर आधिकारिक आंकड़ों में उपलब्ध कराए गए फ्लैट और सीमित डेटा द्वारा बाधित होती है।
परिणाम यह भी दर्शाते हैं कि अपतटीय, एयरबीएनबी और कम उपयोग वाली संपत्तियां सामान्य घरों की तुलना में भौगोलिक रूप से अधिक केंद्रित हैं, और अतिरिक्त रूप से उच्च मूल्य वाले क्षेत्रों में केंद्रित हैं।
[कैप्शन id=”attachment_182749″ align=”alignnone” width=”661″]
उपरोक्त ग्राफ के बारे में, लेखकों ने टिप्पणी की:
‘अपतटीय घरेलू संपत्ति में बहुत उच्च सांद्रता है जहां एक पूरे आवास विकास का स्वामित्व एक अपतटीय कंपनी के पास है।’
लेखकों ने अपने प्रोसेसिंग पाइपलाइन के लिए कोड जारी किया है।
नया शोध पत्र नया पत्र है जिसका शीर्षक लॉन्ड्रोमैट में क्या है? लंदन में अपतटीय स्वामित्व वाली घरेलू संपत्ति का मानचित्रण और चरित्रीकरण है, और यह यूनिवर्सिटी कॉलेज लंदन के द बार्टलेट फैकल्टी ऑफ द बिल्ट एनवायरनमेंट और किंग्सटन यूनिवर्सिटी के अर्थशास्त्र विभाग के शोधकर्ताओं से आया है।
समस्या का समाधान
लेखकों ने उल्लेख किया है कि यूके में रियल एस्टेट के उपयोग को मनी लॉन्डरिंग उद्देश्यों के लिए नियंत्रित करने के दशकों के प्रयासों के बाद, यह 2015 में ब्रिटिश प्रकाशन प्राइवेट आइ द्वारा लीक की गई अपतटीय-स्वामित्व वाली यूके संपत्ति की सूची की रिलीज थी जिसने यूके सरकार को अधिकांश यूके में अपतटीय-स्वामित्व वाली संपत्तियों की एक नियमित रूप से अद्यतन सूची प्रकाशित करने के लिए प्रेरित किया, जिसे इंग्लैंड और वेल्स में संपत्ति के मालिक अपतटीय कंपनियां (ओसीडी) के रूप में जाना जाता है।
शोधकर्ताओं ने观察 किया है कि हालांकि ओसीडी शोध और विश्लेषण के लिए एक कदम आगे है, लेकिन डेटा में कई सीमाएं हैं, जिनमें से कुछ महत्वपूर्ण हैं:
‘इन पतों को अधूरा हो सकता है, जिसमें नेस्टेड संपत्तियां हो सकती हैं, जहां एक ही पंक्ति या शीर्षक संख्या में कई संपत्तियां मौजूद हों, यह घरेलू, व्यवसायिक या अन्य प्रकार की संपत्ति के बारे में कोई जानकारी नहीं देता है। ‘
‘इस तरह के खराब गुणवत्ता वाले डेटा के कारण यूके में अपतटीय स्वामित्व वाली संपत्ति के वितरण और विशेषताओं को समझना चुनौतीपूर्ण है।’
विशेष रूप से एयरबीएनबी संपत्तियों जैसी अनौपचारिक रूप से किराए पर दी जाने वाली संपत्तियों के बारे में डेटा प्राप्त करना मुश्किल है, क्योंकि सार्वजनिक रूप से उपलब्ध डेटा सीमित या अस्तित्वहीन है।
इसके अलावा, स्कॉटलैंड (यूके का एक हिस्सा) अपनी संपत्ति बिक्री के रजिस्टर को सार्वजनिक रूप से उपलब्ध नहीं कराता है, जो इंग्लैंड और वेल्स के विपरीत है।
संपत्ति वर्गीकरण के आसपास की कुछ असंगतताओं को दूर करने के लिए, यूके सरकार ने यूनिक प्रॉपर्टी रेफरेंस नंबर (यूपीआरएन) प्रणाली की शुरुआत की, जिसका उद्देश्य विविध प्रॉपर्टी डेटा स्रोतों में स्पष्ट संबंधों को सक्षम करना है।
हालांकि, लेखकों ने उल्लेख किया है कि ‘यूपीआरएन का उपयोग अनिवार्य है, लेकिन लगभग कोई सरकारी विभाग इसका उपयोग नहीं करता है, जिसका अर्थ है कि डेटा को जोड़ने के लिए उन्नत डेटा प्रोसेसिंग कौशल की आवश्यकता होती है’।
इसलिए, नए शोध ने डेटा को अधिक विस्तृत और अंतर्दृष्टिपूर्ण बनाने का लक्ष्य रखा।
डेटा संग्रह और कनेक्शन
किसी भी व्यक्तिगत देश में, पते के प्रारूप आमतौर पर पredictable और संगत होते हैं, जो यूके पतों पर भी लागू होते हैं।
इसलिए, ‘फ्लैट’, पाठ-आधारित पते वाले डेटा (जैसे कि ओसीडी द्वारा प्रदान किया गया है) के सामने, कई ओपन सोर्स पता पार्सिंग समाधान उभरे हैं जो अन्य डेटा स्रोतों के साथ पतों को क्रॉस-रेफरेंस करने के लिए हैं।
हालांकि, इनमें से कई ओपन स्ट्रीट मैप डेटा का उपयोग करके प्रशिक्षित किए गए हैं, जो ऐसे पते प्रदान कर सकते हैं जो वास्तव में दसियों या सैकड़ों नेस्टेड उप-पतों (जैसे कि एक अपार्टमेंट ब्लॉक के लिए एक व्यापक पते में अपार्टमेंट) को होस्ट कर सकते हैं।
इसके परिणामस्वरूप, यहां तक कि एक प्रतिष्ठित पता पार्सर जैसे लिबपोस्टल को भी कठिनाई हुई है जब उसने अधूरे पतों को पार्स करने का प्रयास किया है।
अपने परियोजना के लिए पार्सर बनाने के लिए, नए पत्र के शोधकर्ताओं ने कई सार्वजनिक रूप से उपलब्ध डेटासेट का उपयोग किया।
मुख्य डेटा ओसीडी द्वारा प्रदान किया गया था, जबकि डेटा क्लीनिंग घटक ने लैंड रजिस्ट्री प्राइस डेटासेट का उपयोग किया, साथ ही वीओए रेटिंग लिस्टिंग डेटासेट, और ऑफिस ऑफ नेशनल स्टैटिस्टिक्स पोस्टकोड डायरेक्टरी (ओएनएसपीडी)।
एयरबीएनबी डेटा इनसाइडएयरबीएनबी डोमेन से आया था, जिसमें केवल पूरे घर शामिल थे जो किराए पर दिए गए थे, इसलिए एयरबीएनबी के मूल प्रस्तावित उपयोग को बाहर कर दिया गया था (अर्थात अपने घर के एक हिस्से को अवसरों पर किराए पर देना)।
शोधकर्ताओं के निम्न-उपयोग संपत्ति डेटासेट को सफल स्वतंत्रता से जानकारी अनुरोधों से प्राप्त जानकारी से बढ़ाया गया था, जो मुख्य रूप से एक पूर्व परियोजना के लिए एकत्र किया गया था।
ओसीडी का आधार डेटा एक .सीएसवी कमा-विभाजित फ़ाइल है जिसमें एक अच्छा स्तर की संरचना और पredictable प्रारूप है।

पाइपलाइन में पांच चरण शामिल थे: लेबलिंग, पार्सिंग, विस्तार, वर्गीकरण, और संकुचन। शुरू में, कोई भी व्यक्तिगत पता वास्तविक जीवन में कई नेस्टेड संपत्तियों को हल कर सकता था, हालांकि यह सरकार द्वारा प्रदान किए गए डेटा में स्पष्ट नहीं है।
शोधकर्ताओं ने कुछ हल्के सिंटैक्टिक प्रीप्रोसेसिंग किए, फिर डेटा को प्रोग्रामेटिक में आयात किया, एक प्लेटफ़ॉर्म जो हाथ से लेबलिंग के बिना एनएलपी डेटासेट बनाने के लिए डिज़ाइन किया गया है। यहां, नियमित अभिव्यक्तियों (रेगेक्स) का उपयोग करके आठ प्रकार के नामित इकाइयों को लेबल करने के लिए किया गया था:

इन लेबल्स को जोड़ने के साथ, डेटासेट को एक जेसन फ़ाइल के रूप में निकाला गया था, जिसमें लेबल ओवरलैप्स को सरल नियम-आधारित दिनचर्या द्वारा हटा दिया गया था।
इसके अलावा, प्रोग्रामेटिक के आउटपुट का उपयोग एक पूर्वानुमान मॉडल को प्रशिक्षित करने के लिए किया गया था स्पेसी के लिए, जो फेसबुक के रोबेर्टा द्वारा समर्थित है। एक बार डिनोइज़ किए जाने के बाद, शोधकर्ताओं ने 1000 यादृच्छिक-लेबल वाले अवलोकनों की एक ग्राउंड ट्रुथ तुलना सेट बनाई। असुपरवाइज्ड डेटा का स्कोर अंततः इस ग्राउंड ट्रुथ के खिलाफ मूल्यांकन किया जाएगा।
पता पार्सिंग ने कई चुनौतियां पेश कीं। लेखकों ने प्रत्येक अक्षर स्पैन को अपनी पंक्ति और प्रत्येक लेबल वर्ग को अपनी कॉलम सौंपी, और फिर पूर्ण पता पंक्तियों को उत्पन्न करने के लिए कॉलम को वापस प्रसारित किया।
चूंकि एकल पते में कई विशिष्ट निवास थे, इसलिए डेटाबेस का विस्तार करना आवश्यक था, जो एकल पतों को पूरक डेटाबेस में मौजूद उप-संपत्तियों में विभाजित करके किया गया था।
इसके बाद, पता वर्गीकरण चरण ने ओएनएसपीडी डेटाबेस का उपयोग करके सभी स्थित पतों को क्रॉस-रेफरेंस किया। यह प्रक्रिया पता डेटा को जनगणना और अन्य जनसांख्यिकीय डेटा से जोड़ती है, और पहले ओसीडी डेटा के पारदर्शी पतों के पीछे छिपी हुई उप-संपत्तियों को व्यक्तिगत करती है।
अंत में, पता संकुचन प्रक्रिया ने नेस्टेड संपत्ति समूहों से गैर-घरेलू संपत्तियों (अर्थात व्यावसायिक परिसर) को फिल्टर किया।
विश्लेषण
अनुमानों और विश्लेषणों की सटीकता का परीक्षण करने के लिए, लेखकों ने पहले उल्लिखित एक नमूना ग्राउंड ट्रुथ सेट बनाया था जिसे सामान्य रन के विश्लेषण से अलग रखा गया था और केवल अनुमानों और विश्लेषणों की सटीकता का परीक्षण करने के लिए उपयोग किया गया था।
मैनुअल चेकिंग में मैप सॉफ़्टवेयर, संपत्तियों की तस्वीरों और इंटरनेट खोजों का विश्लेषण करने के लिए ग्राउंड ट्रुथ सेट का उपयोग किया गया था ताकि संपत्ति के प्रकार का मूल्यांकन किया जा सके। इसके बाद, डेटा के प्रदर्शन को सटीकता, रिकॉल और एफ 1 स्कोर के खिलाफ मापा गया था।
निम्न-उपयोग और घरेलू संपत्ति का मूल्य एक बुनियादी ग्राफ़िकल मॉडल के साथ प्राप्त किया गया था, जिसे यूडीपी संपत्तियों को अनुमान लगाने के लिए भी उपयोग किया गया था।
एनईआर कार्य, उच्च-प्रयास, मैनुअल रूप से लेबल वाले ग्राउंड ट्रुथ के खिलाफ परीक्षण किया गया, जिसने 0.96 का एफ 1 स्कोर प्राप्त किया (सटीकता के संदर्भ में ‘100%’ के करीब)।
[कैप्शन id=”attachment_182754″ align=”alignnone” width=”643″]
लंदन में यूडीपी के संबंध में, अंतिम परिणाम 138,000 प्रविष्टियों को दर्शाते हैं – मूल ओसीडी डेटासेट (अर्थात हाल के आधिकारिक आंकड़ों) में 94,000 की तुलना में 44% अधिक हैं।
[कैप्शन id=”attachment_182755″ align=”alignnone” width=”651″]
परिणाम यह दर्शाते हैं कि अपतटीय संपत्तियों का कुल मूल्य लगभग £56 बिलियन है, जबकि निम्न-उपयोग संपत्ति का कुल मूल्य £85 बिलियन अनुमानित है।
लेखकों ने उल्लेख किया है:
‘[सभी] यूडीपी £600,000 के औसत पारंपरिक संपत्ति मूल्य की तुलना में बहुत अधिक महंगे हैं।’
इस प्रकार के बेहतर डेटा की आवश्यकता यूके में संपत्ति अनुमान के रूप में मनी लॉन्डरिंग को रोकने के लिए हो सकती है। लेखकों ने उल्लेख किया है कि एएमएल संपत्ति अनुमान को रोकने में सुधारित डेटा की मदद करने वाले शोध और साहित्य का बढ़ता हुआ शरीर है, और निष्कर्ष निकालते हैं:
‘यह डेटा समाजशास्त्रियों, अर्थशास्त्रियों और नीति निर्माताओं द्वारा उपयोग किया जा सकता है ताकि यह सुनिश्चित किया जा सके कि मनी लॉन्डरिंग और उच्च संपत्ति मूल्य को कम करने के प्रयास वास्तविक स्थिति को दर्शाने वाले विस्तृत डेटा पर आधारित हैं। ‘
* मेरे द्वारा लेखकों के इनलाइन संदर्भ को हाइपरलिंक में परिवर्तित करना।
पहली बार 25 जुलाई 2022 को प्रकाशित।












