スタブ AI により英国のオフショア不動産所有権の追跡が改善 - Unite.AI
私達と接続

Artificial Intelligence

AI により英国のオフショア不動産所有権の追跡が向上

mm
更新中 on

英国のXNUMXつの大学による新たな研究は、英国、特に非常に価値の高いロンドンの不動産市場における不動産ベースのマネーロンダリングの潜在的な状況をより明らかにすることを目的としている。

プロジェクトの結果によると、「非従来型」国内不動産(つまり、所有者や賃貸人が住居として長期間使用しない不動産)の総数は、ロンドンだけで約138,000万XNUMX件に上る。

この数字は、英国政府によって提供され定期的に更新される公式の数字より 44% 高いです。

研究者らは、英国のオフショア企業が所有する資産の割合、価値、場所、種類について、英国政府が公開している限られた公式情報を拡張するために、さまざまな自然言語処理 (NLP) 技術を追加のデータや裏付け調査とともに使用しました。 、その中で最も儲かるのは首都です。

この調査によると、英国のオフショア、低使用、airbnb スタイル(つまり「カジュアルな職業」)の不動産の総額は、約 145 ~ 174 件の物件を合計すると、144,000 ~ 164,000 億ポンドの価値があることがわかりました。

また、このタイプのオフショア不動産は通常より高価であり、英国内のどこに立地するかによって特徴的なパターンがあることも判明した。

研究者らは、オフショア所有の 型破りな国内財産 (UDP) は国内総価値の 7.5% を占めており、推定価値のうち 56 億ポンドはわずか 42,000 戸の住宅に限定されています。

論文は次のように述べています。

「個々のオフショア不動産は、UDP の基準から見ても非常に高価であり、さらに、それらは強い空間的自動相関によりロンドンの中心部に集中しています。

「対照的に、ネストされたオフショア不動産はロンドン中心部に多少集中していませんが、一般に集中度が高く、空間的な相関性もほとんどありません。」

拡張データの分析により、多数のオフショア不動産が海域の事業体に属していることが示されています。 群衆の依存関係 (CD)の中で、2 番目に多いのはイギリスの海外領土です(下の図で、「PWWXNUMX」は第二次世界大戦後にイギリスから独立した国々を示します)。

新しい論文の結果によると、外国所有資産の処分。 出典: https://arxiv.org/src/2207.10931v1/anc/Offshore_London_Supplementary_material.pdf

新しい論文の結果によると、外国所有資産の処分。 出典: https://arxiv.org/src/2207.10931v1/anc/Offshore_London_Supplementary_material.pdf

同紙は次のように述べている。

「実際には、イギリス領ヴァージン諸島、ジャージー島、ガーンジー島、マン島の 4 つの領土だけが、全不動産の 78% に関連付けられています。」

新たに強化されたデータにより、既知の海外所有不動産内に存在する副資産を特定することが可能になりました。この機能は通常、公式数値で提供される平坦で限られたデータによって妨げられます。

この結果はまた、オフショア、Airbnb、および使用頻度の低い不動産が通常の住宅よりも地理的に著しく集中しており、さらに価値の高い地域に集中していることも示しています。

ロンドンのさまざまなタイプの海外所有不動産に関連するヒート マップ。 出典: https://arxiv.org/pdf/2207.10931.pdf

ロンドンのさまざまなタイプの海外所有不動産に関連する集中マップを視覚化しました。 出典:https://arxiv.org/pdf/2207.10931.pdf

上のグラフについて、著者は次のようにコメントしています。

「オフショアの国内不動産には、住宅開発全体がオフショア会社によって所有されている非常に集中した場所がいくつかあります。」

著者らは、 リリースされたコード 処理パイプラインのために。

  新しい紙 というタイトルです コインランドリーには何があるの? ロンドンのオフショア所有国内不動産のマッピングと特徴付け、そしてユニバーシティ・カレッジ・ロンドンのバートレット建築環境学部とキングストン大学経済学部の研究者によるものです。

問題への対処

著者らは、英国におけるマネーロンダリング目的での不動産の使用を規制する数十年の努力の後、最終的には リリース 英国の出版物により流出した英国のオフショア所有資産のリスト プライベート·アイ 2015 年に英国政府に、英国の大部分で知られるオフショア所有不動産の定期更新リストを発行するよう促しました。 イングランドおよびウェールズに不動産を所有する海外企業 (オコッド).

研究者らは、OCODは英国における海外所有権とマネーロンダリングの可能性に関する研究と分析にとって前進であるものの、データには多くの制限があり、そのうちのいくつかは重大であると観察している。

これらの住所は不完全である場合があり、ネストされたプロパティが含まれている場合があり、単一の行またはタイトル番号内に複数のプロパティが存在します。また、そのプロパティが国内のものか、企業のものか、その他のものであるかについての情報も含まれていません。

「このような低品質のデータにより、英国におけるオフショア所有不動産の分布と特徴を理解することが困難になります。」

公開されているデータが限られているか存在しないため、Airbnb 物件などの気軽に借りられる物件に関するデータを入手することは特に困難です。 さらに、スコットランド (英国の一部) は、イングランドやウェールズとは異なり、独自の不動産売却記録を公開していません。

不動産分類に関する不一致に対処するために、英国政府は固有の不動産参照番号 (UPRN) システムは、多様な不動産データ ソース間のより明確な関係を可能にするように設計されています。 ただし、著者は次のように述べています* 「UPRN の使用は義務付けられていますが、それを使用している政府部門はほとんどありません。つまり、データのリンクには高度な技術が必要です」 データ処理 スキル'.

したがって、新しい研究は、データをより詳細で洞察力に富んだものにすることを目指しました。

データの収集と接続

個々の国内では通常、住所形式は予測可能で一貫性があり、英国の住所にも適用できます。 したがって、「フラットな」テキストベースのアドレス指定データ (OCOD によって提供されるデータなど) に直面して、アドレスを他のデータ ソースと相互参照するためのオープンソースのアドレス解析ソリューションが多数登場しました。

ただし、これらの多くは次を使用してトレーニングされます。 ストリートマップを開く このデータから、実際には数十、場合によっては数百のネストされたサブアドレスをホストする可能性のあるアドレスが生成される可能性があります (アパート ブロックの広範囲のアドレスにあるアパートなど)。 その結果、次のような評判の高いアドレスパーサーでさえも、 郵便局 持っています 困難がありました 不完全なアドレスを解析しようとしたとき。

新しい論文の研究者らは、プロジェクト用のパーサーを作成するために、公開されている多数のデータセットを使用しました。 主要なデータは OCOD によって提供され、データ クレンジング コンポーネントは土地登記価格を使用しました。 データセット、一緒に VOA 評価 リスト データセット、および国家統計局の郵便番号ディレクトリ (ONSPD).

Airbnb データは以下から取得されました。 インサイドAirbnb このドメインには、許可された家全体のみが含まれるため、当初提案されていたAirbnbのユースケース(つまり、自分の家の全部または一部を時折貸し出す)は除外されます。

著者らの使用頻度の低い不動産データセットは、成功した情報公開 (FOI) 要求から受け取った情報によって強化されました。これらの情報のほとんどは、目的のために収集されました。 以前のプロジェクト.

OCOD の基本データは、十分な構造と予測可能な形式を備えたカンマ区切りの .CSV ファイルです。

パイプラインは、ラベル付け、解析、展開、分類、縮小の XNUMX つの段階で構成されています。 当初、個々のアドレスは実際には複数のネストされたプロパティに解決される可能性がありますが、これは政府提供のデータでは明示されていません。

研究者らは、軽い構文的な前処理を実行し、データを プログラム的な、手作業でラベルを付けることなく、アノテーション付きの NLP データセットを作成するように設計されたプラットフォームです。 ここでは、正規表現 (Regex) を使用してエンティティにラベルを付け、XNUMX 種類の名前付きエンティティを記述しました (以下の画像を参照)。

これらのラベルが追加されたデータセットは JSON ファイルとして抽出され、単純なルールベースのルーチンによってラベルの重複が削除されました。

さらに、プログラマティックの出力は、次の予測モデルをトレーニングするために使用されました。 スパシー、Facebookの支援を受けています ロベルタ。 ノイズを除去した後、研究者らは、ランダムにラベル付けされた 1000 個の観測値のグラウンド トゥルース比較セットを作成しました。 教師なしデータの精度スコアは、最終的にはこのグランド トゥルースに照らして評価されます。

アドレス解析には多くの課題がありました。 作成者は、各文字を独自の行にまたがり、各ラベル クラスを独自の列に割り当て、列を逆伝播して完全な住所行を生成しました。

一部の単一の住所には複数の異なる住居が含まれていたため、単一の住所を補完的なデータベースに存在するサブプロパティに分割してデータベースを拡張する必要がありました。

この後、住所分類段階では、ONSPD データベースを使用して、特定されたすべての郵便番号を相互参照します。 これ プロセス 住所データを国勢調査やその他の人口統計データに結び付け、これまで OCOD データの不透明な住所の背後に隠されていたサブプロパティも識別します。

最後に、住所縮小プロセスにより、ネストされた不動産グループからすべての非家庭用不動産 (つまり、商業施設) が除外されました。

分析

強化されたデータの精度をテストするために、著者らは、前述したように、一般的な分析の実行から差し控えられ、予測と分析の精度をテストするためにのみ使用されるサンプルのグラウンド トゥルース セットを作成しました。

地上真実の手動チェックには、地図ソフトウェアの使用、保留されたセットに掲載されている物件の写真の分析、および物件の種類を評価するためのインターネット検索が含まれます。 その後、データのパフォーマンスが適合率、再現率、および F1 スコアに対して測定されました。

使用頻度の低い家庭用プロパティの値は、基本的なグラフィカル モデルを使用して取得されました。これと同じ方法が、UDP プロパティの推論にも使用されました。

NER タスクは、手間のかかる手動でラベル付けされたグランド トゥルースに対してテストされ、F1 スコア 0.96 (精度の点では「100%」に近い) を獲得しました。

NER ラベル付けタスクの F1 スコア。 強化されたデータの構造により、このプロセスでは国内の不動産の数が若干過大評価され、企業の総数が過小評価されるため、多少のばらつきが見られます。

NER ラベル付けタスクの F1 スコア。 強化されたデータの構造により、このプロセスでは国内の不動産の数が若干過大評価され、企業の総数が過小評価されるため、多少のばらつきが見られます。

ロンドンの UDP に関して、最終結果は合計 138,000 のエントリを示しています。これは、元の OCOD データセット (つまり、最近の公式数値) に含まれている 44 より 94,000% 多いです。

タイプ 2 分類における不動産タイプの内訳。

タイプ 2 分類における不動産タイプの内訳。

結果は、オフショア不動産の総額が約 56 億ポンドであるのに対し、低使用不動産の総額は 85 億ポンドと推定されることを示しています。

著者は注意します:

「(すべての)UDP は、従来の平均不動産価格である 600 万ポンドよりもはるかに高価です。」

英国におけるマネーロンダリング活動としての不動産投機の利用に対抗するには、この種の改善されたデータが必要になる可能性がある。 著者らは、データの改善がAML不動産投機との戦いに役立つ可能性を示唆する研究や一般文献が増えていることに注目し、次のように結論づけている。

「社会学者、経済学者、政策立案者はこのデータを利用して、マネーロンダリングや不動産価格の高騰を削減する試みが、現実の状況を反映した詳細なデータに基づいていることを確認することができます。」

 

* 著者のインライン引用をハイパーリンクに変換しました。

初版は25年2022月XNUMX日。