私達ず接続

AI により英囜のオフショア䞍動産所有暩の远跡が向䞊

Artificial Intelligence

AI により英囜のオフショア䞍動産所有暩の远跡が向䞊

mm
曎新䞭 on

英囜のXNUMX぀の倧孊による新たな研究は、英囜、特に非垞に䟡倀の高いロンドンの䞍動産垂堎における䞍動産ベヌスのマネヌロンダリングの朜圚的な状況をより明らかにするこずを目的ずしおいる。

プロゞェクトの結果によるず、「非埓来型」囜内䞍動産぀たり、所有者や賃貞人が䜏居ずしお長期間䜿甚しない䞍動産の総数は、ロンドンだけで玄138,000侇XNUMX件に䞊る。

この数字は、英囜政府によっお提䟛され定期的に曎新される公匏の数字より 44% 高いです。

研究者らは、英囜のオフショア䌁業が所有する資産の割合、䟡倀、堎所、皮類に぀いお、英囜政府が公開しおいる限られた公匏情報を拡匵するために、さたざたな自然蚀語凊理 (NLP) 技術を远加のデヌタや裏付け調査ずずもに䜿甚したした。 、その䞭で最も儲かるのは銖郜です。

この調査によるず、英囜のオフショア、䜎䜿甚、airbnb スタむル぀たり「カゞュアルな職業」の䞍動産の総額は、玄 145  174 件の物件を合蚈するず、144,000  164,000 億ポンドの䟡倀があるこずがわかりたした。

たた、このタむプのオフショア䞍動産は通垞より高䟡であり、英囜内のどこに立地するかによっお特城的なパタヌンがあるこずも刀明した。

研究者らは、オフショア所有の 型砎りな囜内財産 (UDP) は囜内総䟡倀の 7.5% を占めおおり、掚定䟡倀のうち 56 億ポンドはわずか 42,000 戞の䜏宅に限定されおいたす。

論文は次のように述べおいたす。

「個々のオフショア䞍動産は、UDP の基準から芋おも非垞に高䟡であり、さらに、それらは匷い空間的自動盞関によりロンドンの䞭心郚に集䞭しおいたす。

「察照的に、ネストされたオフショア䞍動産はロンドン䞭心郚に倚少集䞭しおいたせんが、䞀般に集䞭床が高く、空間的な盞関性もほずんどありたせん。」

拡匵デヌタの分析により、倚数のオフショア䞍動産が海域の事業䜓に属しおいるこずが瀺されおいたす。 矀衆の䟝存関係 CDの䞭で、2 番目に倚いのはむギリスの海倖領土です䞋の図で、「PWWXNUMX」は第二次䞖界倧戊埌にむギリスから独立した囜々を瀺したす。

新しい論文の結果によるず、倖囜所有資産の凊分。 出兞: https://arxiv.org/src/2207.10931v1/anc/Offshore_London_Supplementary_material.pdf

新しい論文の結果によるず、倖囜所有資産の凊分。 出兞: https://arxiv.org/src/2207.10931v1/anc/Offshore_London_Supplementary_material.pdf

同玙は次のように述べおいる。

「実際には、むギリス領ノァヌゞン諞島、ゞャヌゞヌ島、ガヌンゞヌ島、マン島の 4 ぀の領土だけが、党䞍動産の 78% に関連付けられおいたす。」

新たに匷化されたデヌタにより、既知の海倖所有䞍動産内に存圚する副資産を特定するこずが可胜になりたした。この機胜は通垞、公匏数倀で提䟛される平坊で限られたデヌタによっお劚げられたす。

この結果はたた、オフショア、Airbnb、および䜿甚頻床の䜎い䞍動産が通垞の䜏宅よりも地理的に著しく集䞭しおおり、さらに䟡倀の高い地域に集䞭しおいるこずも瀺しおいたす。

ロンドンのさたざたなタむプの海倖所有䞍動産に関連するヒヌト マップ。 出兞: https://arxiv.org/pdf/2207.10931.pdf

ロンドンのさたざたなタむプの海倖所有䞍動産に関連する集䞭マップを芖芚化したした。 出兞https://arxiv.org/pdf/2207.10931.pdf

䞊のグラフに぀いお、著者は次のようにコメントしおいたす。

「オフショアの囜内䞍動産には、䜏宅開発党䜓がオフショア䌚瀟によっお所有されおいる非垞に集䞭した堎所がいく぀かありたす。」

著者らは、 リリヌスされたコヌド 凊理パむプラむンのために。

圓孊校区の 新しい玙 ずいうタむトルです コむンランドリヌには䜕があるの ロンドンのオフショア所有囜内䞍動産のマッピングず特城付け、そしおナニバヌシティ・カレッゞ・ロンドンのバヌトレット建築環境孊郚ずキングストン倧孊経枈孊郚の研究者によるものです。

問題ぞの察凊

著者らは、英囜におけるマネヌロンダリング目的での䞍動産の䜿甚を芏制する数十幎の努力の埌、最終的には リリヌス 英囜の出版物により流出した英囜のオフショア所有資産のリスト プラむベヌト·アむ 2015 幎に英囜政府に、英囜の倧郚分で知られるオフショア所有䞍動産の定期曎新リストを発行するよう促したした。 むングランドおよびりェヌルズに䞍動産を所有する海倖䌁業 (オコッド).

研究者らは、OCODは英囜における海倖所有暩ずマネヌロンダリングの可胜性に関する研究ず分析にずっお前進であるものの、デヌタには倚くの制限があり、そのうちのいく぀かは重倧であるず芳察しおいる。

これらの䜏所は䞍完党である堎合があり、ネストされたプロパティが含たれおいる堎合があり、単䞀の行たたはタむトル番号内に耇数のプロパティが存圚したす。たた、そのプロパティが囜内のものか、䌁業のものか、その他のものであるかに぀いおの情報も含たれおいたせん。

「このような䜎品質のデヌタにより、英囜におけるオフショア所有䞍動産の分垃ず特城を理解するこずが困難になりたす。」

公開されおいるデヌタが限られおいるか存圚しないため、Airbnb 物件などの気軜に借りられる物件に関するデヌタを入手するこずは特に困難です。 さらに、スコットランド (英囜の䞀郚) は、むングランドやりェヌルズずは異なり、独自の䞍動産売华蚘録を公開しおいたせん。

䞍動産分類に関する䞍䞀臎に察凊するために、英囜政府は固有の䞍動産参照番号 (UPRN) システムは、倚様な䞍動産デヌタ ゜ヌス間のより明確な関係を可胜にするように蚭蚈されおいたす。 ただし、著者は次のように述べおいたす* 「UPRN の䜿甚は矩務付けられおいたすが、それを䜿甚しおいる政府郚門はほずんどありたせん。぀たり、デヌタのリンクには高床な技術が必芁です」 デヌタ凊理 スキル'.

したがっお、新しい研究は、デヌタをより詳现で掞察力に富んだものにするこずを目指したした。

デヌタの収集ず接続

個々の囜内では通垞、䜏所圢匏は予枬可胜で䞀貫性があり、英囜の䜏所にも適甚できたす。 したがっお、「フラットな」テキストベヌスのアドレス指定デヌタ (OCOD によっお提䟛されるデヌタなど) に盎面しお、アドレスを他のデヌタ ゜ヌスず盞互参照するためのオヌプン゜ヌスのアドレス解析゜リュヌションが倚数登堎したした。

ただし、これらの倚くは次を䜿甚しおトレヌニングされたす。 ストリヌトマップを開く このデヌタから、実際には数十、堎合によっおは数癟のネストされたサブアドレスをホストする可胜性のあるアドレスが生成される可胜性がありたす (アパヌト ブロックの広範囲のアドレスにあるアパヌトなど)。 その結果、次のような評刀の高いアドレスパヌサヌでさえも、 郵䟿局 持っおいたす 困難がありたした 䞍完党なアドレスを解析しようずしたずき。

新しい論文の研究者らは、プロゞェクト甚のパヌサヌを䜜成するために、公開されおいる倚数のデヌタセットを䜿甚したした。 䞻芁なデヌタは OCOD によっお提䟛され、デヌタ クレンゞング コンポヌネントは土地登蚘䟡栌を䜿甚したした。 デヌタセット、䞀緒に VOA 評䟡 リスト デヌタセット、および囜家統蚈局の郵䟿番号ディレクトリ (ONSPD).

Airbnb デヌタは以䞋から取埗されたした。 むンサむドAirbnb このドメむンには、蚱可された家党䜓のみが含たれるため、圓初提案されおいたAirbnbのナヌスケヌス぀たり、自分の家の党郚たたは䞀郚を時折貞し出すは陀倖されたす。

著者らの䜿甚頻床の䜎い䞍動産デヌタセットは、成功した情報公開 (FOI) 芁求から受け取った情報によっお匷化されたした。これらの情報のほずんどは、目的のために収集されたした。 以前のプロゞェクト.

OCOD の基本デヌタは、十分な構造ず予枬可胜な圢匏を備えたカンマ区切りの .CSV ファむルです。

パむプラむンは、ラベル付け、解析、展開、分類、瞮小の XNUMX ぀の段階で構成されおいたす。 圓初、個々のアドレスは実際には耇数のネストされたプロパティに解決される可胜性がありたすが、これは政府提䟛のデヌタでは明瀺されおいたせん。

研究者らは、軜い構文的な前凊理を実行し、デヌタを プログラム的な、手䜜業でラベルを付けるこずなく、アノテヌション付きの NLP デヌタセットを䜜成するように蚭蚈されたプラットフォヌムです。 ここでは、正芏衚珟 (Regex) を䜿甚しお゚ンティティにラベルを付け、XNUMX 皮類の名前付き゚ンティティを蚘述したした (以䞋の画像を参照)。

これらのラベルが远加されたデヌタセットは JSON ファむルずしお抜出され、単玔なルヌルベヌスのルヌチンによっおラベルの重耇が削陀されたした。

さらに、プログラマティックの出力は、次の予枬モデルをトレヌニングするために䜿甚されたした。 スパシヌ、Facebookの支揎を受けおいたす ロベルタ。 ノむズを陀去した埌、研究者らは、ランダムにラベル付けされた 1000 個の芳枬倀のグラりンド トゥルヌス比范セットを䜜成したした。 教垫なしデヌタの粟床スコアは、最終的にはこのグランド トゥルヌスに照らしお評䟡されたす。

アドレス解析には倚くの課題がありたした。 䜜成者は、各文字を独自の行にたたがり、各ラベル クラスを独自の列に割り圓お、列を逆䌝播しお完党な䜏所行を生成したした。

䞀郚の単䞀の䜏所には耇数の異なる䜏居が含たれおいたため、単䞀の䜏所を補完的なデヌタベヌスに存圚するサブプロパティに分割しおデヌタベヌスを拡匵する必芁がありたした。

この埌、䜏所分類段階では、ONSPD デヌタベヌスを䜿甚しお、特定されたすべおの郵䟿番号を盞互参照したす。 これ プロセス 䜏所デヌタを囜勢調査やその他の人口統蚈デヌタに結び付け、これたで OCOD デヌタの䞍透明な䜏所の背埌に隠されおいたサブプロパティも識別したす。

最埌に、䜏所瞮小プロセスにより、ネストされた䞍動産グルヌプからすべおの非家庭甚䞍動産 (぀たり、商業斜蚭) が陀倖されたした。

分析

匷化されたデヌタの粟床をテストするために、著者らは、前述したように、䞀般的な分析の実行から差し控えられ、予枬ず分析の粟床をテストするためにのみ䜿甚されるサンプルのグラりンド トゥルヌス セットを䜜成したした。

地䞊真実の手動チェックには、地図゜フトりェアの䜿甚、保留されたセットに掲茉されおいる物件の写真の分析、および物件の皮類を評䟡するためのむンタヌネット怜玢が含たれたす。 その埌、デヌタのパフォヌマンスが適合率、再珟率、および F1 スコアに察しお枬定されたした。

䜿甚頻床の䜎い家庭甚プロパティの倀は、基本的なグラフィカル モデルを䜿甚しお取埗されたした。これず同じ方法が、UDP プロパティの掚論にも䜿甚されたした。

NER タスクは、手間のかかる手動でラベル付けされたグランド トゥルヌスに察しおテストされ、F1 スコア 0.96 (粟床の点では「100%」に近い) を獲埗したした。

NER ラベル付けタスクの F1 スコア。 匷化されたデヌタの構造により、このプロセスでは囜内の䞍動産の数が若干過倧評䟡され、䌁業の総数が過小評䟡されるため、倚少のばら぀きが芋られたす。

NER ラベル付けタスクの F1 スコア。 匷化されたデヌタの構造により、このプロセスでは囜内の䞍動産の数が若干過倧評䟡され、䌁業の総数が過小評䟡されるため、倚少のばら぀きが芋られたす。

ロンドンの UDP に関しお、最終結果は合蚈 138,000 の゚ントリを瀺しおいたす。これは、元の OCOD デヌタセット (぀たり、最近の公匏数倀) に含たれおいる 44 より 94,000% 倚いです。

タむプ 2 分類における䞍動産タむプの内蚳。

タむプ 2 分類における䞍動産タむプの内蚳。

結果は、オフショア䞍動産の総額が玄 56 億ポンドであるのに察し、䜎䜿甚䞍動産の総額は 85 億ポンドず掚定されるこずを瀺しおいたす。

著者は泚意したす

「すべおのUDP は、埓来の平均䞍動産䟡栌である 600 䞇ポンドよりもはるかに高䟡です。」

英囜におけるマネヌロンダリング掻動ずしおの䞍動産投機の利甚に察抗するには、この皮の改善されたデヌタが必芁になる可胜性がある。 著者らは、デヌタの改善がAML䞍動産投機ずの戊いに圹立぀可胜性を瀺唆する研究や䞀般文献が増えおいるこずに泚目し、次のように結論づけおいる。

「瀟䌚孊者、経枈孊者、政策立案者はこのデヌタを利甚しお、マネヌロンダリングや䞍動産䟡栌の高隰を削枛する詊みが、珟実の状況を反映した詳现なデヌタに基づいおいるこずを確認するこずができたす。」

 

* 著者のむンラむン匕甚をハむパヌリンクに倉換したした。

初版は25幎2022月XNUMX日。

機械孊習のラむタヌ、人間の画像合成のドメむンスペシャリスト。Metaphysic.ai の元研究コンテンツ責任者。
個人サむト マヌティンアンダヌ゜ン.ai
お問合せ [メヌル保護]
Twitter: @manders_ai