Connect with us

Η Τεχνητή Νοημοσύνη Προσφέρει Βελτιωμένο Παρακολούθηση της Ιδιοκτησίας Ακινήτων στα Ανοικτά της Ηνωμένου Βασιλείου

Τεχνητή νοημοσύνη

Η Τεχνητή Νοημοσύνη Προσφέρει Βελτιωμένο Παρακολούθηση της Ιδιοκτησίας Ακινήτων στα Ανοικτά της Ηνωμένου Βασιλείου

mm

Νέα έρευνα από δύο πανεπιστήμια του Ηνωμένου Βασιλείου αποσκοπεί στο να ρίξει περισσότερο φως στην πιθανή κατάσταση της πλυσίματος χρημάτων με βάση την ιδιοκτησία ακινήτων στο Ηνωμένο Βασίλειο, και ιδιαίτερα στην πολύτιμη αγορά ακινήτων του Λονδίνου.

Σύμφωνα με τα αποτελέσματα του έργου, ο συνολικός αριθμός “ατυπικών” εγχώριων ιδιοκτησιών (δηλαδή ιδιοκτησιών που δεν χρησιμοποιούνται μακροχρόνια ως κατοικίες από ιδιοκτήτες ή ενοικιαστές) ανέρχεται σε περίπου 138.000 στο Λονδίνο μόνο.

Αυτός ο αριθμός είναι 44% υψηλότερος από τις επίσημες στατιστικές, οι οποίες παρέχονται και ενημερώνονται περιοδικά από την κυβέρνηση του Ηνωμένου Βασιλείου.

Οι ερευνητές χρησιμοποίησαν διάφορες τεχνικές Επεξεργασίας Φυσικής Γλώσσας (NLP), μαζί με επιπλέον δεδομένα και επικυρωμένες έρευνες, για να επεκτείνουν τις περιορισμένες επίσημες πληροφορίες που παρέχει η κυβέρνηση του Ηνωμένου Βασιλείου σχετικά με το ποσοστό, την αξία, την τοποθεσία και τους τύπους ιδιοκτησιών που ανήκουν σε εταιρείες εκτός της χώρας, τις πιο κερδοφόρες των οποίων βρίσκονται στην πρωτεύουσα.

Η έρευνα βρήκε ότι ο συνολικός αριθμός ιδιοκτησιών εκτός της χώρας, χαμηλής χρήσης και τύπου Airbnb (δηλαδή “ελαφράς κατοχής”) στο Ηνωμένο Βασίλειο είναι συλλογικά αξίας μεταξύ £145-174 δισεκατομμυρίων GBP, σε περίπου 144.000-164.000 ιδιοκτησίες.

Βρήκε επίσης ότι οι ιδιοκτησίες εκτός της χώρας αυτού του τύπου είναι συνήθως πιο ακριβές και έχουν χαρακτηριστικά πρότυπα όσον αφορά την τοποθεσία τους στο Ηνωμένο Βασίλειο.

Οι ερευνητές εκτιμούν ότι οι ιδιοκτησίες “ατυπικής οικιστικής ιδιοκτησίας” (UDP) που ανήκουν σε εταιρείες εκτός της χώρας αντιπροσωπεύουν το 7,5% της συνολικής οικιστικής αξίας, και ότι £56 δισεκατομμύρια της εκτιμώμενης αξίας περιορίζονται σε μόλις 42.000 κατοικίες.

Το έγγραφο αναφέρει:

‘Οι ατομικές ιδιοκτησίες εκτός της χώρας είναι πολύ ακριβές, ακόμη και με τα πρότυπα της UDP, επιπλέον είναι συγκεντρωμένες στο κέντρο του Λονδίνου με ισχυρή αυτοσυσχέτιση.

‘Αντίθετα, οι ιδιοκτησίες εκτός της χώρας που είναι ενσωματωμένες είναι κάπως λιγότερο συγκεντρωμένες στο κεντρικό Λονδίνο, αλλά πιο高度 συγκεντρωμένες γενικά, και几乎 δεν υπάρχει χωρική συσχετίση.’

Η ανάλυση των εμπλουτισμένων δεδομένων δείχνει ότι ένα lớn αριθμός ιδιοκτησιών εκτός της χώρας ανήκει σε οντότητες στις Εξαρτήσεις του Στέμματος (CD), με το δεύτερο μεγαλύτερο αριθμό να αντιστοιχεί σε Βρετανικές Υπερπόντιες Εδαφικές Περιοχές (στο παρακάτω γράφημα, ‘PWW2’ σημαίνει χώρες που απέκτησαν ανεξαρτησία από τη Βρετανία μετά τον Δεύτερο Παγκόσμιο Πόλεμο).

Κατανομή ξένης ιδιοκτησίας, σύμφωνα με τα αποτελέσματα από το νέο έγγραφο. Source: https://arxiv.org/src/2207.10931v1/anc/Offshore_London_Supplementary_Material.pdf

Κατανομή ξένης ιδιοκτησίας, σύμφωνα με τα αποτελέσματα από το νέο έγγραφο. Source: https://arxiv.org/src/2207.10931v1/anc/Offshore_London_Supplementary_Material.pdf

Το έγγραφο παρατηρεί:

‘Στην πραγματικότητα, μόνο 4 εδάφη, τα Βρετανικά Παρθένα Νησιά, Τζέρσεϊ, Γκέρνσεϊ και το Νησί του Μαν, συνδέονται με το 78% όλων των ιδιοκτησιών.’

Τα νέα εμπλουτισμένα δεδομένα έχουν κάνει δυνατή την καθορισμό υπο-ιδιοκτησιών που υπάρχουν μέσα σε μια γνωστή ιδιοκτησία εκτός της χώρας – μια ικανότητα που συνήθως εμποδίζεται από τα επίπεδα και περιορισμένα δεδομένα που παρέχονται στις επίσημες στατιστικές.

Τα αποτελέσματα δείχνουν επίσης ότι οι ιδιοκτησίες εκτός της χώρας, χαμηλής χρήσης και τύπου Airbnb είναι αξιοσημείωτα πιο γεωγραφικά συγκεντρωμένες από τα κανονικά σπίτια, και είναι επιπλέον συγκεντρωμένες σε περιοχές υψηλότερης αξίας.

Θερμικές χάρτες σχετικά με διάφορους τύπους ιδιοκτησιών εκτός της χώρας στο Λονδίνο. Source: https://arxiv.org/pdf/2207.10931.pdf

Οπτικοποιημένοι χάρτες σχετικά με διάφορους τύπους ιδιοκτησιών εκτός της χώρας στο Λονδίνο. Source: https://arxiv.org/pdf/2207.10931.pdf

Για το παραπάνω γράφημα, οι συγγραφείς σχολιάζουν:

‘Οι οικιστικές ιδιοκτησίες εκτός της χώρας έχουν κάποιες εξαιρετικά υψηλές συγκεντρώσεις όπου μια ολόκληρη ανάπτυξη κατοικίας ανήκει σε μια εταιρεία εκτός της χώρας.’

Οι συγγραφείς έχουν δημοσιεύσει τον κώδικα για την πipeline επεξεργασίας τους.

Το νέο έγγραφο έχει τον τίτλο Τι υπάρχει στη πλυντήριο; Χαρτογράφηση και χαρακτηρισμός ιδιοκτησιών οικιστικών ιδιοκτησιών εκτός της χώρας στο Λονδίνο, και προέρχεται από ερευνητές στο Τμήμα Οικοδομικής του Πανεπιστημίου του Λονδίνου, και στο Τμήμα Οικονομικών του Πανεπιστημίου Kingston.

Αντιμετώπιση του Προβλήματος

Οι συγγραφείς σημειώνουν ότι μετά από δεκαετίες προσπαθειών για τον έλεγχο της χρήσης της αγοράς ακινήτων για πλυσίματος χρημάτων στο Ηνωμένο Βασίλειο, χρειάστηκε η δημοσίευση μιας διαρρεύουσας λίστας ιδιοκτησιών του Ηνωμένου Βασιλείου που ανήκουν σε εταιρείες εκτός της χώρας από την βρετανική έκδοση Private Eye το 2015, για να προκαλέσει την κυβέρνηση του Ηνωμένου Βασιλείου να δημοσιεύσει μια λίστα που ενημερώνεται τακτικά με ιδιοκτησίες που ανήκουν σε εταιρείες εκτός της χώρας στη większości του Ηνωμένου Βασιλείου, γνωστή ως Εταιρείες εκτός της χώρας που κατέχουν ιδιοκτησίες στην Αγγλία και την Ουαλία (OCOD).

Οι ερευνητές παρατηρούν ότι хотя η OCOD είναι ένα βήμα προς τα εμπρός για την έρευνα και την ανάλυση της ιδιοκτησίας εκτός της χώρας και του πλυσίματος χρημάτων στο Ηνωμένο Βασίλειο, τα δεδομένα έχουν một αριθμό περιορισμών, ορισμένοι από τους οποίους είναι κρίσιμοι:

‘Αυτές οι διευθύνσεις μπορούν να είναι непλήρεις, να περιέχουν ενσωματωμένες ιδιοκτησίες, όπου πολλές ιδιοκτησίες υπάρχουν μέσα σε μια seule γραμμή ή αριθμό τίτλου, και δεν περιέχουν καμία πληροφορία σχετικά με το εάν η ιδιοκτησία είναι οικιστική, εμπορική ή κάτι άλλο.

‘Αυτά τα δεδομένα καλής ποιότητας κάνουν την κατανόηση της κατανομής και των χαρακτηριστικών των ιδιοκτησιών εκτός της χώρας στο Ηνωμένο Βασίλειο μια πρόκληση.’

Είναι ιδιαίτερα δύσκολο να ληφθούν δεδομένα σχετικά με ιδιοκτησίες που ενοικιάζονται偶ικά, όπως οι ιδιοκτησίες τύπου Airbnb, поскольку τα δημόσια διαθέσιμα δεδομένα είναι περιορισμένα ή μη υπαρκτά. Επιπλέον, η Σκωτία (ένα μέρος του Ηνωμένου Βασιλείου) δεν κάνει το δικό της μητρώο πωλήσεων ακινήτων δημόσια διαθέσιμο, σε αντίθεση με την Αγγλία και την Ουαλία.

Για να αντιμετωπιστούν ορισμένες από τις ασυνεπείς γύρω από την ταξινόμηση ιδιοκτησιών, η κυβέρνηση του Ηνωμένου Βασιλείου εισήγαγε το Σύστημα Μοναδικού Αναφοράς Ιδιοκτησιών (UPRN), σχεδιασμένο για να επιτρέψει πιο σαφείς σχέσεις μεταξύ διαφορετικών πηγών δεδομένων ιδιοκτησιών. Ωστόσο, οι συγγραφείς σημειώνουν* ‘ενώ η χρήση του UPRN είναι υποχρεωτική, σχεδόν κανένα υπουργείο δεν το χρησιμοποιεί, مما σημαίνει ότι η σύνδεση των δεδομένων απαιτεί προηγμένα δεδομένα επεξεργασίας δεξιοτήτων.

Έτσι, η νέα έρευνα αποσκοπούσε στο να κάνει τα δεδομένα πιο λεπτομερή και ενημερωμένα.

Συλλογή και Σύνδεση των Δεδομένων

Μέσα σε οποιαδήποτε χώρα, οι μορφές διευθύνσεων είναι συνήθως προβλέψιμες και συνεπείς, εφαρμόσιμες επίσης στις διευθύνσεις του Ηνωμένου Βασιλείου. Έτσι, αντιμετωπίζοντας ‘επίπεδα’, κείμενο-βασισμένα δεδομένα διευθύνσεων (όπως αυτά που παρέχονται από την OCOD), một αριθμός ανοιχτών λύσεων ανάλυσης διευθύνσεων έχει εμφανιστεί για να συνδέσει τις διευθύνσεις με άλλα δεδομένα.

Ωστόσο, πολλά από αυτά έχουν εκπαιδευτεί χρησιμοποιώντας Open Street map δεδομένα, τα οποία μπορούν να οδηγήσουν σε διευθύνσεις που μπορεί να φιλοξενήσουν δεκάδες ή ακόμη και εκατοντάδες ενσωματωμένες υπο-διευθύνσεις (όπως διαμερίσματα σε μια ευρεία διεύθυνση για ένα συγκρότημα διαμερισμάτων). Συνεπώς, ακόμη και μια διακεκριμένη ανάλυση διευθύνσεων όπως libpostal έχει δυσκολία όταν προσπαθεί να αναλύσει непλήρεις διευθύνσεις.

Για να δημιουργήσουν τον αναλυτή για το έργο τους, οι ερευνητές του νέου εγγράφου χρησιμοποίησαν một αριθμό δημόσιων δεδομένων. Τα βασικά δεδομένα παρέχθηκαν από την OCOD, ενώ το συστατικό καθαρισμού δεδομένων χρησιμοποίησε το σύνολο δεδομένων Land Registry Price, μαζί με το VOA ratings λίστα δεδομένων, και το Γραφείο Εθνικής Στατιστικής Postcode Directory (ONSPD).

Τα δεδομένα Airbnb προήλθαν από το InsideAirbnb domain, το οποίο περιλαμβάνει μόνο ολόκληρα σπίτια που ενοικιάζονται, εξαιρουμένων των αρχικών προτεινόμενων χρήσεων για το Airbnb (δηλαδή ενοικίαση ολόκληρου ή μέρους του δικού σας σπιτιού σε περιπτωσιακή βάση).

Η βάση δεδομένων ιδιοκτησιών χαμηλής χρήσης των ερευνητών εμπλουτίστηκε με πληροφορίες που λήφθηκαν από επιτυχείς αιτήσεις Ελευθερίας της Πληροφόρησης (FOI), τις περισσότερες από τις οποίες συλλέχθηκαν για παλαιότερο έργο.

Τα βασικά δεδομένα της OCOD είναι ένα αρχείο .CSV με μια καλή βαθμίδα δομής και προβλέψιμης μορφής.

Η διαδικασία αποτελούσε από πέντε στάδια: επισήμανση, ανάλυση, επέκταση, ταξινόμηση και σύμβαση. Στο ξεκίνημα, οποιαδήποτε διεύθυνση θα μπορούσε να λυθεί στην πραγματική ζωή σε πολλές ενσωματωμένες ιδιοκτησίες, αν και αυτό δεν είναι σαφές στα δεδομένα της κυβέρνησης.

Οι ερευνητές πραγματοποίησαν κάποια ελαφριά συντακτική προεπεξεργασία, και στη συνέχεια εισήγαγαν τα δεδομένα στο programmatic, μια πλατφόρμα σχεδιασμένη για να δημιουργήσει αναノτιμένα δεδομένα NLP χωρίς χειροκίνητη επισήμανση. Εδώ, οι οντότητες επισήμανθηκαν χρησιμοποιώντας κανονικές εκφράσεις (Regex) για να περιγράψουν οκτώ τύπους ονομασμένων οντοτήτων (βλέπε εικόνα παρακάτω):

Με αυτές τις επισήμανσεις, το σύνολο δεδομένων εξαγόταν ως αρχείο JSON, με τις επισήμανσεις που επικαλύπτονται να αφαιρούνται από απλές κανόνες-βασισμένες ρουτίνες.

Επιπλέον, η έξοδος του programmatic χρησιμοποιήθηκε για να εκπαιδεύσει ένα προβλέψιμο μοντέλο για SpaCy, υποστηριζόμενο από το Facebook’s RoBERTa. Όταν καθαρίστηκε, οι ερευνητές δημιούργησαν ένα σύνολο σύγκρισης 1000 τυχαία-επισήμανων παρατηρήσεων. Το σκορ ακρίβειας των μη-εποπτευόμενων δεδομένων θα αξιολογηθεί τελικά ενάντια σε αυτό το σύνολο σύγκρισης.

Η ανάλυση διευθύνσεων παρουσίασε μια σειρά από προκλήσεις. Οι συγγραφείς έκαναν κάθε χαρακτήρα να έχει τη δική του γραμμή και κάθε τάξη επισήμανσης να έχει τη δική της στήλη, και στη συνέχεια επαναχαρακτήριζαν τις στήλες για να δημιουργήσουν πλήρεις γραμμές διευθύνσεων.

Καθώς ορισμένες đơnικές διευθύνσεις είχαν πολλές διαφορετικές κατοικίες, ήταν απαραίτητο να επεκτείνουν τη βάση δεδομένων, υποδιαιρώντας τις đơnικές διευθύνσεις σε υπο-ιδιοκτησίες που υπάρχουν σε συμπληρωματικά δεδομένα.

Μετά από αυτό, το στάδιο ταξινόμησης διευθύνσεων ανταποκρίνουν όλες τις τοποθετημένες κωδικούς ταχυδρομείου χρησιμοποιώντας τη βάση δεδομένων ONSPD. Αυτή η διαδικασία συνδέει τα δεδομένα διευθύνσεων με δεδομένα απογραφής και άλλα δημογραφικά δεδομένα, και επίσης ατομικεύει υπο-ιδιοκτησίες που είχαν προηγουμένως κρυφτεί πίσω από τις αδιαφανείς διευθύνσεις των δεδομένων της OCOD.

Τέλος, η διαδικασία σύμβασης διευθύνσεων φιλτράρει όλα τα μη-οικιστικά ιδιοκτησίες (δηλαδή εμπορικές εγκαταστάσεις) από τις ενσωματωμένες ομάδες ιδιοκτησιών.

Ανάλυση

Για να δοκιμάσουν την ακρίβεια των εμπλουτισμένων δεδομένων, οι συγγραφείς, όπως αναφέρθηκε νωρίτερα, δημιούργησαν ένα δείγμα σύνολο σύγκρισης που κρατήθηκε πίσω από τη γενική διαδικασία ανάλυσης, και χρησιμοποιήθηκε μόνο για να δοκιμάσει την ακρίβεια των προβλέψεων και αναλύσεων.

Η χειροκίνητη επαλήθευση για το σύνολο σύγκρισης περιελάμβανε τη χρήση λογισμικού χαρτών, καθώς και ανάλυση εικόνων των ιδιοκτησιών που εμφανίζονται στο σύνολο σύγκρισης, και του ιντερνέτ αναζητήσεων για να αξιολογήσουν τον τύπο ιδιοκτησίας. Στη συνέχεια, η απόδοση των δεδομένων μετρήθηκε ενάντια σε ακρίβεια, ανακληση, και F1 σκορ.

Η αξία των ιδιοκτησιών χαμηλής χρήσης και οικιστικών ιδιοκτησιών λήφθηκε με ένα βασικό γραφικό μοντέλο, την ίδια μέθοδο που χρησιμοποιήθηκε επίσης για να συναγάγει ιδιοκτησίες UDP.

Η εργασία NER, δοκιμασμένη ενάντια στο υψηλό-προσπάθεια, χειροκίνητα-επισήμανση σύνολο σύγκρισης, έλαβε ένα F1 σκορ 0,96 (κοντά στο ‘100%’, σε όρους ακρίβειας).

F1 σκορ για την εργασία NER. Κάποια ανισότητα βρίσκεται, поскольку η διαδικασία ελαφρώς υπερεκτιμά τον αριθμό των οικιστικών ιδιοκτησιών και υποεκτιμά τον συνολικό αριθμό των εμπορικών, λόγω της δομής των εμπλουτισμένων δεδομένων.

F1 σκορ για την εργασία NER. Κάποια ανισότητα βρίσκεται, поскольку η διαδικασία ελαφρώς υπερεκτιμά τον αριθμό των οικιστικών ιδιοκτησιών και υποεκτιμά τον συνολικό αριθμό των εμπορικών, λόγω της δομής των εμπλουτισμένων δεδομένων.

Σχετικά με τις UDP στο Λονδίνο, τα τελικά αποτελέσματα δείχνουν einen συνολικό αριθμό 138.000 εγγραφών – 44% περισσότερο από τις 94.000 που εμφανίζονται στο αρχικό σύνολο δεδομένων OCOD (δηλαδή, πρόσφατες επίσημες στατιστικές).

Η διάσπαση των τύπων ιδιοκτησιών υπό την ταξινόμηση τύπου 2.

Η διάσπαση των τύπων ιδιοκτησιών υπό την ταξινόμηση τύπου 2.

Τα αποτελέσματα δείχνουν ότι η συνολική αξία των ιδιοκτησιών εκτός της χώρας ανέρχεται σε περίπου £56 δισεκατομμύρια, ενώ η συνολική αξία των ιδιοκτησιών χαμηλής χρήσης εκτιμάται σε £85 δισεκατομμύρια.

Οι συγγραφείς σημειώνουν:

‘Όλες οι UDP είναι πολύ πιο ακριβές από την μέση τιμή των £600.000.’

Είδος αυτής της βελτιωμένης δεδομένων μπορεί να είναι απαραίτητο για να καταπολεμήσει τη χρήση της αγοράς ακινήτων ως δραστηριότητας πλυσίματος χρημάτων στο Ηνωμένο Βασίλειο. Οι συγγραφείς σημειώνουν την αυξανόμενη ποσότητα ερευνών και γενικής βιβλιογραφίας που υποδηλώνει ότι η βελτιωμένη δεδομένα μπορεί να βοηθήσει στην καταπολέμηση της αγοράς ακινήτων και των υψηλών τιμών, και καταλήγουν:

‘Αυτά τα δεδομένα μπορούν να χρησιμοποιηθούν από κοινωνιολόγους, οικονομολόγους και πολιτικούς για να διασφαλίσουν ότι οι προσπάθειες για τη μείωση του πλυσίματος χρημάτων και των υψηλών τιμών ακινήτων βασίζονται σε λεπτομερή δεδομένα που ανταποκρίνονται στην πραγματική κατάσταση.’

 

* Η μετατροπή των συγγραφέων της εσωτερικής αναφοράς σε υπερσυνδέσμους.

Πρώτη δημοσίευση 25ης Ιουλίου 2022.

Συγγραφέας για τη μηχανική μάθηση, ειδικός σε τομέα συνθέσεων εικόνων ανθρώπων. Πρώην επικεφαλής ερευνών περιεχομένου στη Metaphysic.ai.
Προσωπικός ιστότοπος: martinanderson.ai
Επικοινωνία: [email protected]