Artificial Intelligence
Siostam moladh AI Soulmate stèidhichte air ìomhaighean a-mhàin
Tha luchd-rannsachaidh às an RA air lìonraidhean neural a chleachdadh gus siostam molaidh a tha gu tur stèidhichte air ìomhaigh a leasachadh airson geamannan cinn-latha air-loidhne a bheir aire a-mhàin a bheil no nach eil dithis luchd-cleachdaidh air an tàladh gu dealbhan a chèile (seach fiosrachadh pròifil leithid obair, aois, msaa. ).
Canar Temporal Image-Based Reciprocal Recommender (TIRR) ris an t-siostam a thig às, agus bidh e a’ cleachdadh Recurrent Neural Networks (RNNn) gus ro-shealladh eachdraidheil neach-cleachdaidh a mhìneachadh airson aghaidhean ris an coinnich e no i fhad ‘s a bhios iad a’ brobhsadh airson maidsean a dh’fhaodadh a bhith ann.
Tha pàipear tha còir aige - is dòcha gu mì-mhisneachail - Dealbhan A bheil a h-uile dad a dh’ fheumas tu airson moladh dà-thaobhach ann an dol air-loidhne, agus a’ tighinn bho dhithis neach-rannsachaidh aig Oilthigh Bristol, a’ leasachadh gu sònraichte air siostam coltach ris (ris an canar ImRec) air a leigeil ma sgaoil leis an aon sgioba ann an 2020.
Ann an deuchainnean, fhuair an siostam cruinneas ùr-nodha na chomas ro-innse cómhalach maidsean eadar luchd-cleachdaidh, a’ leasachadh chan ann a-mhàin air obair an luchd-rannsachaidh ann an 2020, ach cuideachd air siostaman molaidhean dà-thaobhach eile stèidhichte air susbaint a bheir aire do fhiosrachadh nas mionaidiche, stèidhichte air teacsa ann am pròifilean cinn-latha.
Seata dàta dàta fìor-saoghail
Chaidh TIRR a thrèanadh air fiosrachadh luchd-cleachdaidh air a thoirt seachad le seirbheis cinn-latha air-loidhne ‘mòr-chòrdte’ le ‘grunn mhillean neach-cleachdaidh clàraichte’, a leigeas le luchd-cleachdaidh conaltradh a dhèanamh le chèile a-mhàin aon uair ‘s gu bheil gach fear air‘ còrdadh ’a ri ìomhaigh an neach eile. Bha an fho-sheata de dhàta a chaidh a chleachdadh a’ toirt a-steach cuspairean 200,000, air an roinn gu cothromach eadar fir is boireannaich, agus timcheall air 800,000 roghainn air an cur an cèill le neach-cleachdaidh thairis air na pròifilean cinn-latha gu lèir.
Leis nach eil an t-seirbheis suirghe gun urra a tha a’ toirt seachad an dàta a’ toirt taic ach do gheamannan heterosexual, cha robh ach maidsean fireann / boireann air an còmhdach san rannsachadh.
Bidh TIRR a’ leasachadh air dealbhadh siostaman molaidh dà-thaobhach (RRS) roimhe seo san raon seo le bhith a’ tomhas gu dìreach an coltachd gum bi maids eadar dà phròifil, stèidhichte air ìomhaighean pròifil a-mhàin. An àite sin bha siostaman roimhe seo a’ ro-innse dà roghainn aon-stiùiridh agus an uairsin gan cruinneachadh gus ro-innse fhaighinn.
Chuir an luchd-rannsachaidh às do luchd-cleachdaidh a chaidh a thoirt a-mach às an t-seirbheis cinn-latha (airson adhbhar sam bith, a’ toirt a-steach fàgail gu saor-thoileach), agus chuir iad às do phròifilean nach robh a’ toirt a-steach dealbhan aghaidh.
Bha eachdraidh luchd-cleachdaidh cuingealaichte ri aon bhliadhna air ais, gus neo-riaghailteachdan a dh’ fhaodadh tachairt a sheachnadh leis gu robh an làrach suirghe ag atharrachadh a h-algorithms thar ùine. Bha iad cuideachd cuingealaichte ri 15 roghainnean luchd-cleachdaidh aig a’ char as àirde, leis gun robh iad sin air an dearbhadh mar gu leòr airson dealbhadh a’ mhodail a dhearbhadh, fhad ‘s a bha cleachdadh nas fharsainge de roghainnean a’ lughdachadh coileanadh agus ag àrdachadh amannan trèanaidh.
A bharrachd air an sin, bha eachdraidh aig cuid den luchd-cleachdaidh as èasgaidh no san fhad-ùine mìltean de roghainnean, a dh’ fhaodadh a bhith air cunnart cuideam nam feartan a fhuaireadh a lughdachadh, agus amannan trèanaidh a leudachadh.
Lìonra Siamese
Tha TIRR air a dhealbhadh a’ cleachdadh a Lìonra Siamese, mar as trice air a chleachdadh airson ionnsachadh 'aon-shot'.
Chaidh an lìonra a thrèanadh a’ cleachdadh crossentropy binary, gnìomh call cumanta ann an lìonraidhean neural, agus fear a lorg an luchd-rannsachaidh a thug seachad toraidhean nas fheàrr an taca ri call coimeasach. Tha an tè mu dheireadh as èifeachdaiche ann an siostaman a bhios a’ measadh co-ionannachd eadar dà aghaidh, ach leis nach e seo amas TIRR, is e dòigh-obrach a th’ ann a tha a’ coileanadh gu dona sa cho-theacsa seo.
Tha e riatanach gum bi an siostam a’ cumail agus a’ togail air an fhiosrachadh a bhios e a’ leasachadh mar a bhios an trèanadh ag ath-aithris iomadh uair thairis air an aon dàta, agus tha lìonra Siamese ann an TIRR a’ cleachdadh an LSTM (Cuimhne Geàrr-ùine Fad-ùine) gus na co-dhùnaidhean sin a dhèanamh, agus gus dèanamh cinnteach nach tèid feartan air am meas iomchaidh a thoirt air falbh ad hoc mar a bhios am frèam a’ togail a bheachdan.
Lorg an luchd-rannsachaidh gun do rinn an lìonra trèanadh gu math slaodach nuair a chaidh an dàta gu lèir a chuir a-steach, agus às deidh sin roinn an trèanadh ann an trì ìrean a’ cleachdadh trì fo-bhuidhnean eadar-dhealaichte den dàta. Tha buannachd a bharrachd ann an seo, leis gu robh deuchainnean 2020 an luchd-rannsachaidh air sealltainn mar-thà gu bheil trèanadh dàta fireann is boireann air leth a’ leasachadh coileanadh siostam molaidh dà-thaobhach.
Deuchainn
Gus coileanadh TIRR a mheasadh, chùm an luchd-rannsachaidh cuibhreann den dàta a fhuaireadh gu aon taobh agus ruith iad tron t-siostam làn-cho-aonaichte. Ach, leis gu bheil an siostam gu math ùr, chan eil siostaman ro-chosmhail dìreach ann ris am faodar coimeas a dhèanamh.
Mar sin stèidhich an luchd-rannsachaidh an toiseach Curve Caractar Gnìomh Glacadair (ROC) bun-loidhne airson lìonra Siamese, mus cleachd thu Uniform Manifold Tuairmse agus Ro-mheasadh airson Lùghdachadh Meudachd (UMAP) gus na vectaran 128-mheudach a lughdachadh airson sealladh furasta, gus sruth ciallach de rudan a tha dèidheil air agus nach toil leat a stèidheachadh.
Chaidh TIRR a dhearbhadh an aghaidh siostaman sìoltachaidh co-obrachail agus stèidhichte air susbaint le raon coltach ris, a’ toirt a-steach obair ro-làimh an luchd-rannsachaidh ImRec (faic gu h-àrd), agus RECON, RRS bho 2010, a bharrachd air na h-algorithms sìoltachaidh co-obrachail RCF (RRS deit 2015 stèidhichte air susbaint teacsa de phròifil cinn-latha) agus LFRR (pròiseact coltach ris bho 2019).
Anns a h-uile cùis bha e comasach dha TIRR cruinneas nas fheàrr a thabhann, ged nach robh e ach beagan an taca ri LFRR, is dòcha a’ nochdadh feartan co-cheangail eadar susbaint teacsa ìomhaigh agus an ìre tarraingeach de dhealbhan ìomhaigh nan cuspairean.
Tha an faisg air co-ionannachd eadar TIRR stèidhichte air ìomhaigh agus an LFRR stèidhichte air teacsa a’ ceadachadh co-dhiù dà chothrom: gum bi buaidh aig susbaint teacsa nam pròifilean air tuigse luchd-cleachdaidh air tarraingeachd lèirsinneach; no gum faigh susbaint teacsa barrachd aire agus aonta na dh’ fhaodadh a bhith air tachairt mura robh an dealbh co-cheangailte ris air fhaicinn mar rud tarraingeach.
Air adhbharan follaiseach, chan urrainn don sgioba rannsachaidh an stòr-dàta no an còd tùsail airson TIRR a leigeil ma sgaoil, ach sgiobaidhean eile a bhrosnachadh gus an dòigh-obrach aca a dhùblachadh agus a dhearbhadh.
nb Tha na h-ìomhaighean a chleachdar sa phrìomh dhealbh bho thispersondoesnotexist.com.