stub Ku Hoosaynta 'Runta' ee duugowday ee Mashiinka Barashada - Unite.AI
Connect nala

Sirdoonka Artificial

Ku Muujinta 'Runta' Dhacday Iyadoo la adeegsanayo Barashada Mashiinka

mm
Updated on

Mararka qaarkood runtu waxay leedahay taariikh dhicis. Marka sheegashada waqti xaddidan (sida 'maskaxdu ay ku qasban yihiin gaadiidka dadweynaha') ay ka soo baxaan qiimeynta mashiinka raadinta, xalkeeda 'awoodda' ee muuqata waxay ka dheeraan kartaa soo dhaweyntiisa xitaa sanado badan, oo ka sarreeya macluumaadka dambe iyo saxsanaanta mawduuca.

Tani waa wax ka soo baxay matoorka raadinta 'algorithms' go'aaminta iyo kor u qaadida xalalka 'mudda-dheer' ee xalalka dhabta ah, iyo karti-xirfadeedkooda si ay u kala hormariyaan waxyaabaha si wanaagsan ugu xiran ee ilaalinaya taraafikada waqti ka dib - iyo dabeecad sii kordheysa ee ixtiraamka macluumaadka cusub da'da soo baxda wararka been abuur ah.

Taas beddelkeeda, qiimo dhimista macluumaadka mareegaha ee qiimaha leh sababtoo ah shaabada wakhtiyada la xidhiidha ayaa ka gudubtay 'daaqad ansax ah' oo aan sabab lahayn ayaa khatar gelinaysa in jiilka nuxurka waxtarka leh si toos ah hoos loogu dhigi doono iyada oo la door bidaayo waxyaabaha soo socda ee laga yaabo inay noqdaan heer hoose.

Si loo hagaajiyo xanuunkan, mid cusub warqad Cilmi-baarayaal ku sugan Talyaaniga, Belgium iyo Danmark waxay adeegsadeen farsamooyin kala duwan oo lagu barto mashiinka si ay u horumariyaan habka darajada caddaynta waqti-ogsoon.

Ka Gudbo Jawaabaha Dhacday

Warqadda waxaa qoray cilmi-baarayaal ka socda Guddiga Yurub ee Xarunta Cilmi-baarista Wadajirka ah (JRC) ee Ispra, Katholieke Universiteit ee Leuven, iyo Jaamacadda Kobanheegan.

Shaqadu waxay tixgalinaysaa afar hab oo qiimayn ku meel gaar ah oo lagu dabaqay saddex hab oo xaqiiqo-hubin ah, mid walbana leh hab ka duwan darajo caddaynta, oo waxay bixisaa hab cusub oo loogu talagalay darajooyinka isticmaala cadaymaha waqtiyada 'heerka dahabka'. Daraasadu waxay muujinaysaa in darajooyinka caddaynta ee wakhtiga lagu baraarugsan yahay ay hagaajiso aragtida natiijooyinka, iyo sidoo kale waxay wanaajisaa awoodda iyo saadaasha dhabta ah ee xaqiiqooyinka xasaasiga ah iyo sheegashooyinka.

Cilmi-baarista waxaa loo soo bandhigaa sida suurtogalka ah ee ku xiran hababka dambe ama hadda jira, waxaana loogu talagalay in lagu caawiyo cilmi-baarista, iyo sida arrin dheeraad ah oo suurtogal ah oo lagu daro horumarinta algorithms cusub oo horumarsan.

Shaqadu waxay qaabaysaa dhaqdhaqaaqa ku meel gaadhka ah ee caddaynta hubinta xaqiiqada ku salaysan, waxayna ka sarraysaa hababka 'isku ekaanshaha semantic' ee ay qaateen algorithms-yada caadiga ah ee raadinta raadinta. Qaabka ay tababareen cilmi-baarayaashu waxay adeegsadaan mid la wanaajiyey barashada-derajada shaqada taas oo si fudud loogu dul-kordhin karo qaab-dhismeedka xaqiiqo-hubinta jirta. Cilmi baadhayaashu waxay ku doodayaan in nidaamku yahay wax ku biirin cusub oo ku saabsan hubinta tooska ah.

Wax ka beddelka Dhismayaasha Xaqiiqda-Hubinta Badan

Cilmi-baadhayaashu waxay ku soo rogeen qodobbada wakhtiga xaddidan ee saddex qaab-dhismeedka xaqiiqooyinka ee jira. Midka ugu horreeya ee kuwan ka mid ah waa nooca xusuusta muddada-gaaban ee laba jiho (BiLSTM) ee lagu soo jeediyay gudaha Xogta MultiFC oo la sii daayay sanadkii 2019.

Midda labaad waa wax ka beddelka kan koowaad, oo leh isku-xidhka neerfaha ee soo noqnoqda (RNN) oo beddelaya qaybta LSTM.

Qaabka saddexaad ee ay cilmi-baarayaashu adeegsadeen waa a Transformer-ka DistilBERT Laga soo bilaabo maktabadda Wajiyada Hugging, oo ah nooca Google-ka ee la jeexjeexay BERT Qaabka NLP.

Dhammaan saddexda qaab-dhismeed, cilmi-baarayaashu waxay adeegsadeen khasaare ListMLE, cilmi-baaris ay hoggaaminayso Microsoft, taas oo si joogto ah gacan uga geysatey cilmi-baarista xaqiiqooyinka cusub labaatankii sano ee la soo dhaafay.

Labada nooc ee xaqiiqada hubinta aasaasiga ah ee kooxda cilmi-baadhistu ay ku dartay qayb ku meel gaadh ah oo ah shaandhaynta maamulka iyo qiimaynta soo socota. Xigasho: https://arxiv.org/pdf/2009.06402.pdf

Labada nooc ee xaqiiqo-hubinta aasaasiga ah ee kooxda cilmi-baadhistu ay ku dartay qayb ku meel gaadh ah oo ah shaandhaynta maamulka iyo qiimaynta soo socota. Xigasho: https://arxiv.org/pdf/2009.06402.pdf

Qiimaha shaambada wakhtiga ayaa laga soo saaray xogta badan ee tababarka, waxaana lagu daray qodobbada darajada ee nooc kasta.

Imtixaanka

Qiimaynta tijaabada ah ee nidaamka waxay ku lug leedahay isticmaalka xogta xogta MultiFC, maadaama ay hadda tahay kaydka xogta furan ee mugga sare ee keliya ee loo heli karo xiisaha cilmi-baarista gaarka ah. MultiFC waxay ka kooban tahay 34,924 sheegasho-dhabta ah oo laga helay 26 goobood oo xaqiiqo- hubin ah oo kala duwan, oo ay ku jiraan Snopes iyo Washington Post.

Saadaasha sheegashada kasta oo run ah waxa lagu kordhiyey toban cadaymo oo kooban oo ay bixiso Google Search API, iyo saadaasha lagu helay isku dhafka walxaha, oo ay ku jiraan hadalka, tags iyo qaybaha.

Inta badan shaambada-waqtiga ku habboon maahan midda ku jirta xogta badan; maqaal ayaa laga yaabaa inuu tixraaco dhacdooyin waqtiyo hore ah, iyo kiiskan nidaamyada cilmi-baarayaashu waxay ahayd inay taxaddaraan si ay u soo saaraan oo ay xogtaas si toos ah uga beddelaan qoraalka. Nidaamkan la'aanteed, 'dib u socodsiinta' ee wararka duugoobay waxay u badan tahay inay siinayso dhalaal cusub, gaar ahaan marka la eego goobaha maamulka sare, oo faafinaya xogta la bedelay.

Taariikhaha waxaa lagu soo saaray hab joogto ah Python, iyo taariikhaha xogta badan ee rasmiga ah ee lagu tijaabiyay joogtaynta qaabaynta (maadaama, tusaale ahaan, US iyo UK qaabaynta taariikhda shaambada way ka duwan tahay). Markii gacanta lagu xaqiijiyay, khaladaad eber ah ayaa laga helay xogta badan ee waqtiga-shaambada.

Natiijooyinka

Marka la eego hubinta gacanta ee natiijooyinka otomaatiga ah, cilmi-baarayaashu waxay ogaadeen in darajooyinka caddaynta waqtiga-ogaalka ah ay si gaar ah u wanaajiyeen fikradaha ku habboon ee ku saleysan isku midka ah semantic saafi ah ama qiimeynta SERPs. Waxa kale oo ay hubiyaan in habkoodu uu hagaajiyo saadaasha dhabta ah ee sheegashooyinka wakhtiga xasaasiga ah (tusaale, duruufaha ay xaalad wareed si degdeg ah isu beddesho, iyo halka ay lama huraan tahay in macluumaadka cusub la sii kala hormariyo iyada oo aan kaliya lagu qasbin mudnaanta koowaad ee ugu dambaysay. Natiijooyinka mawduuc).

Cilmi-baadhayaashu waxay xuseen in habkani uu noqon doono mid qiimo sare leh oo lagu hagaajinayo moodooyinka darajada ee mawduucyada is-bedbeddelaya sida siyaasadda iyo madadaalada, halkaas oo akhbaartu si degdeg ah isu beddesho, iyo horumarinta darajada sare waxay u baahan tahay qaab si toos ah hoos u dhigista dhibcaha ugu sarreeya ee darajada laga yaabo inay leeyihiin. lagu gaaray sii deynta.