stub Aqoonsiga Mawduuca la kafaala qaaday ee Goobaha Wararka ee Mashiinka Barashada - Unite.AI
Connect nala

Sirdoonka Artificial

Aqoonsiga Mawduuca la kafaala qaaday ee Goobaha Wararka ee Mashiinka Barashada

mm
Updated on

Cilmi-baarayaal Nederlaan ah ayaa soo saaray hab cusub oo mashiinka wax lagu baranayo kaas oo awood u leh inuu kala saaro waxyaabaha la kafaala qaaday ama haddii kale lacagta lagu bixiyo ee gudaha goobaha wararka, si sax ah in ka badan 90%, taasoo ka jawaabaysa xiisaha sii kordhaya ee ka imanaya xayeysiiyayaashu qaababka xayeysiiska 'hooyo' ee ay adag tahay in la sameeyo. ka sooca wax soo saarka saxafiga 'dhabta ah'.

cusub ee warqad, cinwaan looga dhigay Kala soocida Ganacsiga iyo Nuxurka Tafatirka ee Wararka, waxay ka timid cilmi-baarayaal ka tirsan jaamacadda Leiden.

Garaaf-hoosaadyo ganacsi (casaan) iyo tafatir (buluug) oo ka soo baxaya falanqaynta xogta. Xigasho: https://arxiv.org/pdf/2111.03916.pdf

Garaaf-hoosaadyo ganacsi (casaan) iyo tafatir (buluug) oo ka soo baxaya falanqaynta xogta. Xigasho: https://arxiv.org/pdf/2111.03916.pdf

Qorayaashu waxay eegayaan in inkasta oo daabacado culculus, oo si fudud u sheegi kara ereyada xayaysiiyayaasha, ay samayn doonaan dadaal macquul ah si ay u kala saaraan 'waxyaabaha lammaanaha' iyo guud ahaan wararka iyo falanqaynta, jaangooyooyinka ayaa si tartiib tartiib ah laakiin si aan macquul ahayn ugu wareegaya isdhexgalka korodhka ee u dhexeeya tifaftirka. iyo kooxaha ganacsiga ee meel ka soo baxa, kuwaas oo ay u arkaan isbeddel naxdin leh oo xun.

"Awoodda lagu qarin karo waxa ku jira, rabitaan ama rabitaan la'aan, iyo suurtogalnimada in xayaysiisyada aan la aqoonsanin xitaa haddii si sax ah loo calaamadiyey waa muhiim. Suuqgeeyayaashu waxay ugu yeeraan hooyo [xayeysiis] sabab awgeed.'

Tusaalooyinka hadda jira ee xayaysiisyada waddaniga ah, oo si kala duwan loogu yeero 'content partner', 'content brand', iyo rafcaan kale oo badan oo loogu talagalay in si qarsoodi ah loo qariyo farqiga u dhexeeya nuxurka asalka ah iyo kuwa ganacsi ahaan loo meeleeyay ee goobaha saxafiyiinta.

Tusaalooyinka hadda jira ee xayaysiisyada waddaniga ah, oo si kala duwan loogu yeero 'content partner', 'content brand', iyo rafcaan kale oo badan oo loogu talagalay in si qarsoodi ah loo qariyo farqiga u dhexeeya nuxurka asalka ah iyo kuwa ganacsi ahaan loo meeleeyay ee goobaha saxafiyiinta.

Shaqada waxaa la fuliyay iyada oo qayb ka ah baaritaan ballaaran oo lagu sameeyay dhaqanka wararka ee shabakadaha ACED Reverb Channel, oo fadhigeedu yahay Amsterdam, kaas oo xoogga saaraya falanqaynta xogta ku salaysan ee isbeddellada saxafiga ah.

Helitaanka Xogta

Si loo horumariyo xogta ilaha mashruuca, qorayaashu waxay adeegsadeen 1,000 maqaalo iyo 1,000 xayaysiis ah oo ka yimid afar xarumood oo wararka Nederlaan ah waxayna u kala sooceen iyaga oo ku saleysan sifooyinkooda qoraal. Maadaama xog-ururinta ay ahayd cabbir yar, qorayaashu waxay iska fogeeyeen habab heersare ah sida BERT, oo taa beddelkeeda waxay qiimeeyeen waxtarka qaababka barashada mashiinka qadiimiga ah, oo ay ku jiraan Taageerada Mashiinka Vector (SVM), LinearSVC, Geedka Go'aanka, Kaymaha Random, K-Deriska Ugu Dhaw (K-NN), Hoos udhaca Stochastic Gradient (SGD) iyo Naïve Bayes.

Reverb Channel corpus waxa uu awooday in uu keeno 1,000-ka maqaal ee 'toos' ah ee lagama maarmaanka u ah, laakiin qorayaashu waa in ay si toos ah uga xoqaan xayaysiisyada afarta shabakadood ee Nederlaan ah ee la soo bandhigay. Xogta la helay ayaa ah la heli karo qaab xaddidan (sababo la xiriira xuquuqda daabacaada) ee GitHub, oo ay la socdaan qaar ka mid ah koodka Python ee loo isticmaalo in lagu helo laguna qiimeeyo xogta.

Afarta daabacaad ee la darsay waxay ahaayeen muxaafid siyaasadeed Nu.nl, horumarka badan Telegraph, NRC, iyo joornaalka ganacsiga De Ondernemer. Daabacaad kasta si isku mid ah ayaa loogu matalay xogta.

Waxa lama huraan noqotay in la aqoonsado oo la dhimo 'daliilayaasha' suurtagalka ah ee ku jira qaamuuska ay cilmi-baadhistu samaysay - ereyada ka soo bixi kara labada nooc ee nuxurka iyada oo aan farqi yar u dhexayn inta jeer ee ay isticmaalaan iyo isticmaalkooda, si loo sameeyo habab cad oo loogu talagalay nuxurka asalka ah iyo kuwa la kafaala-qaaday.

Natiijooyinka

Dhammaan hababka lagu tijaabiyay aqoonsiga, natiijooyinka ugu wanaagsan waxaa helay SVM, linearSVC, Random Forest iyo SGD. Sidaa darteed cilmi-baarayaashu waxay sii wateen inay isticmaalaan SVM falanqayn dheeraad ah.

Habka ugu fiican ee qaabka ugu wanaagsan ee soo saarista kala-soocidda guud ahaan corpus ayaa dhaaftay 90% saxnaanta, in kasta oo cilmi-baarayaashu ay xuseen in helista kala saarid cad ay sii adkaanayso marka laga hadlayo daabacaadyada ku jihaysan B2B, halkaas oo isku dhafka qaamuuska ah ee u dhexeeya nuxurka 'dhabta' iyo 'kafiilsan' xad-dhaaf ah - laga yaabee sababta oo ah qaabka hooyo ee luqadda ganacsigu waa horeba ka maskax badan yahay socodsiinta guud ee heshiisyada warbixinta iyo falanqaynta, oo si fudud u qarin kara ajandaha.

t-Qaybinta Stochastic Neighbor Embedding (t-SNE) qorshayaasha kala soocida nuxurka dhabta ah iyo kuwa la kafaalo qaaday ee afarta daabacaad.

t-Isku-xidhka Deriska Stochastic Qaybsan (t-SNE) qorshayaal lagu kala saarayo nuxurka dhabta ah iyo kuwa la kafaala qaaday ee afarta daabacaad.

Ma nuxurka la kafaala qaaday 'war been abuur ah'?

Cilmi-baadhista qorayaashu waxay soo jeedinaysaa in mashruucu yahay mid cusub oo ku saabsan falanqaynta nuxurka wararka. Qaab-dhismeedka awoodda u leh in lagu aqoonsado macluumaadka la kafaala qaaday ayaa waddada u xaari kara horumarinta la socodka sannad-sanadlaha ee dheelitirka u dhexeeya saxafiga ujeeddada leh iyo qaybta sii kordheysa ee 'xayaysiimaha asaliga ah' kaas oo ku fadhiya ku dhawaad ​​isla macnaha guud ee daabacadaha, iyadoo la adeegsanayo tilmaamo muuqaal ah ( Qaababka CSS iyo qaabaynta kale) sida nuxurka guud.

Dareen gaar ah, la'aanta joogtada ah ee macnaha guud ee nuxurka la kafaala qaaday ayaa u soo baxaya sidii qayb-hoosaadka daraasadda 'war been abuur ah'. In kasta oo madbacadaha intooda badani ay garwaaqsadaan baahida loo qabo kala-soocidda 'kaniisadda iyo dawladda', iyo waajibaadka ah in la siiyo akhristayaasha kala qaybsanaan cad oo u dhexeeya macluumaadka lacag-bixinta ah iyo kuwa asal ahaan laga soo saaray, xaqiiqada dhabta ah ee saxafiyiinta daabacan ka dib, iyo kordhinta ku-tiirsanaanta xayeysiiyaasha, ayaa soo jeestay. Hoos-u-dhigista tilmaamayaasha la kafaala qaaday ee farshaxanka wanaagsan ee cilmi-nafsiga UI. Mararka qaarkood abaal-marinnada socodsiinta nuxurka la kafaala qaaday ayaa ah kuwo soo jiidasho leh oo khatar gelin kara a musiibo indhaha weyn.

Sannadkii 2015-kii warbaahinta bulshada iyo madal qiimaynta tartanka ayaa Quintly bixisay ogaanshaha AI ku salaysan habka si loo go'aamiyo in boostada Facebook la kafaalo qaaday, iyada oo sheeganaysa saxnaanta heerka 96%. Sannadka xiga, a waxbarasho oo ka socda Jaamacadda Georgia ayaa ku dooday in sida madbacadaha u maareeyaan ku dhawaaqista waxyaabaha la kafaala qaaday ay noqon karto ' khiyaano ku adag'.

2017 MediaShift, oo ah hay'ad baara isgoysyada warbaahinta iyo tignoolajiyada, la arkay Xaddiga sii kordhaya ee uu New York Times ku maal galiyo hawlihiisa iyada oo loo marayo istuudiyaha nuxurka summadaysan, T Brand Studio, iyada oo sheeganaya hoos u dhaca heerarka daahfurnaanta ee ku xeeran waxyaabaha la kafilo, iyada oo natiijada ula kac ah ee aan akhristayaasha si fudud u sheegi karin in nuxurku si dabiici ah loo soo saaray iyo in kale.

2020, hindise kale oo cilmi baaris ah oo Nederlaan ah ayaa soo saartay kala soocida barashada mashiinka si toos ah u aqoonsan Wararka ay dawladda Ruushku maalgeliso ee ka soo baxa warbaahinta Serbian-ka. Dheeraad ah, waxay ahayd qiyaasey sanadka 2019 in Forbes''xalalka warbaahinta' ay ku xisaabtamaan 40% wadarta dakhligeeda iyada oo loo marayo BrandVoice, istuudiyaha nuxurka ah ee uu bilaabay daabacaha 2010.