stub Tha AI a’ tabhann lorg nas fheàrr air seilbh seilbh thar-oirthir san RA - Unite.AI
Ceangal leinn

Artificial Intelligence

Tha AI a’ tabhann lorg nas fheàrr air seilbh seilbh thar-oirthir san RA

mm
Ùraichte on

Tha rannsachadh ùr bho dhà oilthigh san RA ag amas air barrachd solas a thilgeil air an t-suidheachadh a dh’ fhaodadh a bhith ann an airgead-airgid stèidhichte air seilbh san Rìoghachd Aonaichte, agus gu sònraichte ann am margaidh thogalaichean Lunnainn a tha air leth prìseil.

A rèir toraidhean a’ phròiseict, tha an àireamh iomlan de thogalaichean dachaigheil ‘neo-ghnàthach’ (ie togalaichean nach eil air an cleachdadh san fhad-ùine le sealbhadairean no luchd-màil) mu 138,000 ann an Lunnainn a-mhàin.

Tha am figear seo 44% nas àirde na na h-àireamhan oifigeil, a tha air an solarachadh agus air an ùrachadh bho àm gu àm le riaghaltas na RA.

Chleachd an luchd-rannsachaidh grunn dhòighean Pròiseas Cànain Nàdarra (NLP), còmhla ri dàta a bharrachd agus rannsachadh dearbhach, gus am fiosrachadh oifigeil cuibhrichte a tha riaghaltas na RA a’ toirt seachad a leudachadh mun àireamh sa cheud, luach, àite agus an seòrsa seilbh a tha aig companaidhean aig muir san RA. , agus tha an fheadhainn as prothaidiche dhiubh anns a 'phrìomh-bhaile.

Lorg an rannsachadh gu bheil luach iomlan de thogalaichean far-oirthir, cleachdadh ìosal, agus stoidhle airbnb (ie ‘sealbhachadh cas’) san RA còmhla eadar £ 145-174 billean GBP thairis air timcheall air 144,000-164,000 togalach.

Lorg e cuideachd gu bheil togalaichean far-oirthir den t-seòrsa seo mar as trice nas daoire agus gu bheil pàtrain ainm-sgrìobhte aca a thaobh far a bheil iad suidhichte san RA.

Tha an luchd-rannsachaidh a 'meas gu bheil seilbh aig muir Seilbh dachaigh neo-àbhaisteach (UDP) a’ riochdachadh 7.5% den luach dachaigheil iomlan, agus gu bheil £56 billean den luach a thathar a’ meas air a chuingealachadh ri dìreach 42,000 taigh-còmhnaidh.

Tha am pàipear ag ràdh:

“Tha togalaichean fa-leth aig muir gu math daor eadhon a rèir inbhean UDP, a bharrachd air an sin tha iad stèidhichte ann am meadhan Lunnainn le co-dhàimh càr làidir spàsail.

'An coimeas ri sin tha togalaichean neadachaidh far a' chladaich beagan nas cuingealaichte ann am meadhan Lunnainn ach nas dùmhaile san fharsaingeachd, cha mhòr nach eil co-dhàimh spàsail ann cuideachd.'

Tha mion-sgrùdadh air an dàta leasaichte a’ sealltainn gu bheil àireamh mhòr de thogalaichean far-oirthir a’ buntainn ri buidhnean anns an Euslaintean Sluaigh (CD), leis an dàrna àireamh as motha air a chunntas le British Overseas Territories (sa chairt gu h-ìosal, tha ‘PWW2’ a’ comharrachadh dhùthchannan a fhuair neo-eisimeileachd bho Bhreatainn às deidh an Dàrna Cogadh).

A’ faighinn cuidhteas seilbh cèin, a rèir toraidhean a’ phàipear ùir. Stòr: https://arxiv.org/src/2207.10931v1/anc/Offshore_London_Supplementary_Material.pdf

A’ faighinn cuidhteas seilbh cèin, a rèir toraidhean a’ phàipear ùir. Stòr: https://arxiv.org/src/2207.10931v1/anc/Offshore_London_Supplementary_Material.pdf

Tha am pàipear a’ toirt fa-near:

'Gu dearbh chan eil ach 4 sgìrean, Eileanan Virgin Bhreatainn, Jersey, Guernsey agus Eilean Mhanainn, co-cheangailte ri 78% de na togalaichean air fad.'

Tha an dàta leasaichte ùr air a dhèanamh comasach fo-sheilbh a dhearbhadh a tha ann an togalach aithnichte thall thairis - comas a tha mar as trice air a bhacadh leis an dàta rèidh agus cuibhrichte a chaidh a thoirt seachad anns na figearan oifigeil.

Tha na co-dhùnaidhean cuideachd a’ nochdadh gu bheil togalaichean far-oirthir, Airbnb agus cleachdadh ìosal gu sònraichte nas cuimsichte a thaobh cruinn-eòlas na dachaighean àbhaisteach, agus gu bheil iad cuideachd ann an sgìrean le luach nas àirde.

Mapaichean teas co-cheangailte ri diofar sheòrsaichean de sheilbh le sealbh thall thairis ann an Lunnainn. Stòr: https://arxiv.org/pdf/2207.10931.pdf

Mapaichean cruinneachaidh lèirsinneach co-cheangailte ri diofar sheòrsaichean de thogalaichean le seilbh thall thairis ann an Lunnainn. Stòr: https://arxiv.org/pdf/2207.10931.pdf

Den ghraf gu h-àrd, tha na h-ùghdaran a’ toirt beachd air:

'Tha dùmhlachd fìor àrd aig togalaichean dachaigheil far-tìre far a bheil leasachadh taigheadais gu lèir le companaidh aig muir.'

Tha aig na h-ùghdaran còd air a leigeil ma sgaoil airson an loidhne-phìoban giollachd aca.

Tha pàipear ùr leis an tiotal Dè a th' anns an laundromat? A’ mapadh agus a’ comharrachadh thogalaichean dachaigheil aig muir ann an Lunnainn, agus a’ tighinn bho luchd-rannsachaidh aig Dàmh Bartlett na h-Àrainneachd Thogte aig Colaiste Oilthigh Lunnainn, agus Roinn Eaconamas Oilthigh Kingston.

A 'dèiligeadh ris an Trioblaid

Tha na h-ùghdaran a’ toirt fa-near, às deidh deicheadan de oidhirp gus smachd a chumail air cleachdadh thogalaichean airson adhbhar airgead-airgid san Rìoghachd Aonaichte, gun tug e an release de liosta a chaidh a leigeil ma sgaoil de sheilbh aig muir na RA leis an fhoillseachadh Breatannach Sùilean Prìobhaideach ann an 2015 gus spionnadh a thoirt do riaghaltas na RA liosta fhoillseachadh gu cunbhalach de thogalaichean aig muir sa mhòr-chuid den RA, ris an canar Companaidhean thall thairis aig a bheil seilbh ann an Sasainn agus sa Chuimrigh (OCOD).

Tha an luchd-rannsachaidh a’ cumail a-mach ged a tha OCOD na cheum air adhart gu rannsachadh agus mion-sgrùdadh air seilbh thall thairis agus airgead a dh’ fhaodadh a bhith air a ghlanadh san RA, tha grunn chuingealachaidhean aig an dàta, cuid dhiubh deatamach:

“Faodaidh na seòlaidhean sin a bhith neo-choileanta, bidh togalaichean neadachaidh ann, far a bheil grunn thogalaichean taobh a-staigh aon sreath no àireamh tiotal, chan eil fiosrachadh ann cuideachd a bheil an togalach dachaigheil, gnìomhachais no rudeigin eile.

'Tha an leithid de dhàta de dhroch chàileachd ga dhèanamh dùbhlanach tuigse fhaighinn air cuairteachadh agus feartan seilbh aig muir aig muir san RA.'

Tha e gu sònraichte duilich dàta fhaighinn mu thogalaichean air màl cas leithid togalaichean Airbnb, leis gu bheil dàta a tha ri fhaighinn gu poblach cuibhrichte no gun a bhith ann. A bharrachd air an sin chan eil Alba (pàirt den Rìoghachd Aonaichte) a’ dèanamh a clàr fhèin de reic thogalaichean ri fhaighinn gu poblach, eu-coltach ri Sasainn agus a’ Chuimrigh.

Gus cuir an aghaidh cuid de neo-chunbhalachd a thaobh seòrsachadh thogalaichean, thug riaghaltas na RA a-steach an Àireamh Iomraidh Seilbh Sònraichte (UPRN) siostam, air a dhealbhadh gus dàimhean nas soilleire a chomasachadh thar diofar stòran dàta seilbh. Ach, tha na h-ùghdaran a’ toirt fa-near * ‘ged a tha cleachdadh an UPRN òrdaichte, cha mhòr nach eil roinn riaghaltais ga chleachdadh, a’ ciallachadh gu bheil ceangal an dàta feumach air adhartas giollachd dàta sgilean'.

Mar sin bha an rannsachadh ùr ag amas air an dàta a dhèanamh nas grinne agus nas lèirsinneach.

A 'cruinneachadh agus a' ceangal an dàta

Taobh a-staigh dùthaich fa leth sam bith, mar as trice bidh cruthan seòlaidh ro-innseach agus cunbhalach, a’ buntainn ri seòlaidhean na RA cuideachd. Mar sin, an aghaidh dàta seòlta ‘rèidh’, stèidhichte air teacsa (leithid an fheadhainn a thug OCOD seachad), tha grunn fhuasglaidhean parsadh seòlaidhean fosgailte air nochdadh gu seòlaidhean tar-iomraidh gu stòran dàta eile.

Ach, tha mòran dhiubh sin air an trèanadh airson cleachdadh Mapa Sràid Fosgailte dàta, a bheir seachad seòlaidhean a dh’ fhaodadh aoigheachd a thoirt do dheich no eadhon ceudan de fo-sheòlaidhean neadachaidh (leithid àrosan ann an seòladh farsaing airson bloc àros). Mar thoradh air an sin, bidh eadhon parser seòlaidhean cliùiteach leithid libearalach Tha bha duilgheadas aige nuair a thathar a’ feuchainn ri seòlaidhean neo-choileanta a pharsadh.

Gus am parser a chruthachadh airson a’ phròiseict aca, chleachd luchd-rannsachaidh a’ phàipeir ùir grunn stòran-dàta a bha rim faighinn gu poblach. Chaidh am prìomh dhàta a thoirt seachad le OCOD, agus chleachd am pàirt glanadh dàta Prìs Clàr an Fhearainn seata dàta, còmhla ris an Ìrean VOA a’ liostadh an dàta, agus Leabhar-seòlaidh Còd-puist Oifis nan Staitistig Nàiseanta (ONSPD).

Thàinig an dàta Airbnb bhon Taobh a-staigh Airbnb fearann, nach eil a’ toirt a-steach ach dachaighean slàn a tha air an leigeil a-steach, mar sin a’ dùnadh a-mach a’ chùis cleachdaidh tùsail a chaidh a mholadh airson Airbnb (ie a’ toirt air màl an dachaigh agad fhèin gu lèir no pàirt dheth bho àm gu àm).

Chaidh dàta seilbh cleachdadh ìosal nan ùghdaran a leudachadh le fiosrachadh a fhuaireadh bho iarrtasan soirbheachail Saorsa Fiosrachaidh (FOI), a chaidh a chruinneachadh sa mhòr-chuid airson pròiseact nas tràithe.

Tha an dàta bunaiteach aig OCOD na fhaidhle .CSV le cromag le ìre mhath de structar agus cruth a tha dùil.

Bha còig ìrean anns an loidhne-phìoban: bileagan, parsadh, leudachadh, seòrsachadh agus cùmhnantachadh. Aig a’ chiad dol a-mach, dh’ fhaodadh seòladh fa-leth fuasgladh fhaighinn ann am fìor bheatha do dh’iomadh togalach neadachaidh, ged nach eil seo follaiseach anns an dàta a thug an riaghaltas seachad.

Rinn an luchd-rannsachaidh beagan ro-phròiseasadh syntactic aotrom, an uairsin thug iad a-steach an dàta gu prògramaichte, àrd-ùrlar a chaidh a dhealbhadh gus stòran-dàta NLP le notaichean a chruthachadh gun bileagan làimhe. An seo, chaidh buidhnean a chomharrachadh le bhith a’ cleachdadh abairtean cunbhalach (Regex) gus cunntas a thoirt air ochd seòrsaichean de dh’ eintiteas ainmichte (faic an dealbh gu h-ìosal):

Leis na bileagan sin air an cur ris, chaidh an stòr-dàta a thoirt a-mach mar fhaidhle JSON, le tar-lùbadh leubail air a thoirt air falbh le cleachdaidhean sìmplidh stèidhichte air riaghailtean.

A bharrachd air an sin, chaidh toradh a’ phrògram a chleachdadh gus modal ro-innseach a thrèanadh airson SpaCaidh, le taic bho Facebook RoBERTa. Aon uair ‘s gun deach a dhol às àicheadh, chruthaich an luchd-rannsachaidh seata coimeas fìrinn talmhainn de 1000 amharc le bileagan air thuaiream. Bhiodh sgòr cruinneas dàta gun stiùireadh air a mheasadh mu dheireadh an aghaidh na fìrinn talmhainn seo.

Thug parsadh sheòlaidhean grunn dhùbhlain air adhart. Shònraich na h-ùghdaran do gach caractar a shreath fhèin agus gach clas leubail a cholbh fhèin, agus an uairsin chuir iad air ais na colbhan gus sreathan seòlaidh iomlan a ghineadh.

Leis gu robh grunn àiteachan-còmhnaidh sònraichte ann an cuid de sheòlaidhean singilte, bha e riatanach an stòr-dàta a leudachadh, le bhith a’ roinneadh sheòlaidhean singilte gu fo-sheòlaidhean a bha an làthair ann an stòran-dàta taiceil.

Às deidh seo, rinn an ìre seòrsachadh seòlaidhean tar-iomradh air a h-uile còd-puist a chaidh a shuidheachadh a’ cleachdadh stòr-dàta ONSPD. Seo pròiseas a’ ceangal dàta nan seòlaidhean ri dàta cunntais agus dàta deamografach eile, agus cuideachd a’ sònrachadh fo-sheilbh a bha air am falach roimhe seo air cùl seòlaidhean neo-shoilleir dàta OCOD.

Mu dheireadh, shìol am pròiseas giorrachadh seòlaidhean a h-uile togalach neo-dhachaigheil (ie togalaichean malairteach) bho bhuidhnean seilbh neadachaidh.

Mion-sgrùdadh

Gus dearbhadh dè cho ceart ‘s a tha an dàta leasaichte, chruthaich na h-ùghdaran, mar a chaidh ainmeachadh na bu thràithe, seata fìrinn talmhainn sampaill a chaidh a chumail air ais bhon ruith anailis choitcheann, agus a chleachdadh a-mhàin gus cruinneas ro-innse agus mion-sgrùdaidhean a dhearbhadh.

Bha sgrùdadh làimhe airson fìrinn na talmhainn a’ toirt a-steach cleachdadh bathar-bog mapa, a bharrachd air mion-sgrùdadh air dealbhan de na feartan anns an t-seata air a chumail air ais, agus rannsachaidhean eadar-lìn gus an seòrsa seilbh a mheasadh. Às deidh sin, chaidh coileanadh an dàta a thomhas a rèir mionaideachd, ath-ghairm, agus sgòran F1.

Chaidh luach cleachdadh ìosal agus seilbh dachaigheil fhaighinn le modail grafaigeach bunaiteach, an aon dòigh air a chleachdadh cuideachd gus feartan UDP a thoirt a-steach.

Fhuair gnìomh NER, a chaidh a dhearbhadh an aghaidh na fìrinn talmhainn àrd-oidhirp, le bileagan làimhe, sgòr F1 de 0.96 (faisg air ‘100%’, a thaobh cruinneas).

Sgòran F1 airson gnìomh labeling NER. Tha beagan mì-chothromachd air a lorg, leis gu bheil am pròiseas beagan a’ dèanamh cus tuairmse air an àireamh de thogalaichean dachaigheil agus a’ dèanamh dì-meas air an àireamh iomlan de ghnìomhachasan, air sgàth structar an dàta leasaichte.

Sgòran F1 airson gnìomh labeling NER. Tha beagan mì-chothromachd air a lorg, leis gu bheil am pròiseas beagan a’ dèanamh cus tuairmse air an àireamh de thogalaichean dachaigheil agus a’ dèanamh dì-meas air an àireamh iomlan de ghnìomhachasan, air sgàth structar an dàta leasaichte.

A thaobh UDPn ann an Lunnainn, tha na toraidhean deireannach a’ sealltainn 138,000 inntrigeadh gu h-iomlan - 44% nas motha na an 94,000 a bha a’ nochdadh anns an t-seata dàta OCOD tùsail (ie, figearan oifigeil o chionn ghoirid).

Briseadh sìos seòrsaichean seilbh fo sheòrsachadh seòrsa 2.

Briseadh sìos seòrsaichean seilbh fo sheòrsachadh seòrsa 2.

Tha na co-dhùnaidhean a’ nochdadh gu bheil luach iomlan nan togalaichean aig muir timcheall air £56 billean, agus thathas a’ meas gu bheil luach iomlan thogalaichean le cleachdadh ìosal aig £85 billean.

Tha na h-ùghdaran a’ toirt fa-near:

'Tha [na h-uile] CDU mòran nas daoire na a' phrìs àbhaisteach àbhaisteach de £600 mìle.'

Dh’ fhaodadh gum bi feum air an seòrsa dàta leasaichte seo gus cuir an-aghaidh cleachdadh prothaideachadh seilbh mar ghnìomhachd airgead-airgid san RA. Tha na h-ùghdaran a’ toirt fa-near don bhuidheann rannsachaidh agus litreachas coitcheann a tha a’ sìor fhàs a tha a’ moladh gum faodadh dàta leasaichte cuideachadh le bhith a’ cuir an-aghaidh prothaideachadh seilbh AML, agus a’ co-dhùnadh:

'Faodar an dàta seo a chleachdadh le sòiseo-eòlaichean, eaconamaiche agus luchd-dèanamh phoileasaidhean gus dèanamh cinnteach gu bheil oidhirpean gus airgead-airgid a lùghdachadh agus prìsean àrda seilbh stèidhichte air dàta mionaideach a tha a' nochdadh an fhìor shuidheachadh.'

 

* An tionndadh agam de luaidh in-loidhne nan ùghdaran gu ceanglaichean eadar-lìn.

Air fhoillseachadh an toiseach air 25 Iuchar 2022.