stub 10 Algorithms Barashada Mashiinka ugu Wanaagsan (2024) - Unite.AI
Connect nala

Best Of

10 Algorithm ee Barashada Mashiinka ugu Wanaagsan

mm
Updated on

In kasta oo aan ku noolnahay waqti cusub oo aan caadi ahayn oo ku saabsan barashada mashiinka dardar-gelinta GPU-da, waraaqaha cilmi-baarista ee ugu dambeeyay si joogto ah (iyo si muuqata) waxay muujinayaan algorithms kuwaas oo tobaneeyo sano jir ah, xaaladaha qaarkood 70 sano jir.

Qaar ayaa laga yaabaa inay ku doodaan in qaar badan oo ka mid ah hababkan da'da ah ay ku dhacaan xerada 'falanqaynta tirakoobka' halkii ay ka baran lahaayeen mashiinka, oo ay doorbidaan inay taariikhda soo galaan qaybta soo noqoshada kaliya ilaa 1957, iyada oo ikhtiraacida Perceptron.

Marka la eego ilaa xadka algorithms-yada da'da wayn ay taageeraan oo ay ku duugan yihiin isbeddelladii ugu dambeeyay iyo horumarinta cinwaannada soo jiidashada ee barashada mashiinka, waa mawqif lagu tartami karo. Haddaba aan eegno qaar ka mid ah dhismayaasha 'classic' ee ka mid ah hal-abuurradii ugu dambeeyay, iyo sidoo kale qaar ka mid ah kuwa cusub ee soo gelaya kuwaas oo samaynaya dalab hore oo loogu talagalay hoolka caanka ah ee AI.

1: Transformers

Sannadkii 2017 Google Research wuxuu horseeday iskaashi cilmi-baaris oo ku dhammaaday warqad Feejignaan Waa Dhammaan Waxaad U Baahan Tahay. Shaqadu waxay qeexday qaab-dhismeedka cusub ee kor u qaaday hababka dareenka laga bilaabo 'tubooyinka' ee kujira cod-dejiyaha iyo moodooyinka shabakadda ee soo noqnoqda ilaa farsamada isbeddelka dhexe ee iyaga u gaar ah.

Habka ayaa la isku daray transformer, oo tan iyo markaas noqday habka kacaanka ee Habraaca Luqadda Dabiiciga ah (NLP), awood, ka mid ah tusaalayaal kale oo badan, qaabka luqadda is-difaacida iyo AI boodhka-ilmaha GPT-3.

Transformers si xarrago leh u xalliyaan dhibaatada isku xigxiga transduction, sidoo kale loo yaqaan 'transformation', kaas oo lagu mashquulsan yahay habaynta taxanaha wax-soo-saarka. Transformer-ku waxa kale oo uu u helaa oo u maareeyaa xogta si joogto ah, halkii uu ka ahaan lahaa dufcadaha isdaba jooga ah, taas oo u oggolaanaysa 'joogteynta xusuusta' taas oo naqshadaha RNN aan loogu talagelin in la helo. Si aad u hesho dulmar faahfaahsan oo dheeraad ah oo ku saabsan transformers, eeg maqaalkeena tixraaca.

Si ka duwan shabakadaha Neural-ka ee soo noqnoqda (RNNs) ee bilaabay inay xukumaan cilmi-baarista ML ee xilligii CUDA, qaab-dhismeedka Transformer sidoo kale wuxuu noqon karaa mid sahlan. barbar socda, furitaanka dariiqa wax soo saarka leh ee wax looga qabanayo xog ururin aad uga weyn kan RNNs.

Isticmaalka caanka ah

Transformers ayaa qabsaday mala-awaalka dadweynaha sanadka 2020 markii la siidaayay OpenAI's GPT-3, kaas oo ku faanay rikoodh jabin markaas 175 bilyan oo cabbir. Guushan sida muuqata la yaabka leh ayaa aakhirkii waxaa hadheeyay mashruucyo dambe, sida 2021-ka sii daayo ee Megatron-Turing NLG 530B ee Microsoft, kaas oo (sida magacu tilmaamayo) ka kooban yahay 530 bilyan oo cabbir.

Jadwal ka mid ah mashaariicda Transformer NLP hyperscale. Xigasho: Microsoft

Jadwal ka mid ah mashaariicda Transformer NLP hyperscale. Source: Microsoft

Qaab dhismeedka beddelka ayaa sidoo kale ka gudbay NLP una gudbay aragga kumbuyuutarka, isagoo awood u leh a jiil cusub Qaab-dhismeedka isku-dhafka sawirka sida OpenAI's Clip iyo SLAB, kuwaas oo adeegsada qoraalka>maabaynta goobta sawirka si ay u dhamaystiraan sawirada aan dhamaystirnayn oo ay u soo saaraan sawiro cusub oo laga soo qaatay goobo tababaran, oo ka mid ah tirada sii kordheysa ee codsiyada la xidhiidha.

DALL-E waxay isku daydaa inay dhammaystirto qayb ka mid ah sawirka baska Plato. Xigasho: https://openai.com/blog/dall-e/

DALL-E waxay isku daydaa inay dhammaystirto qayb ka mid ah sawirka baska Plato. Xigasho: https://openai.com/blog/dall-e/

2: Isku-xidhka Adversarial Networks (GANs)

In kasta oo Transformers ay heleen daboolid warbaahineed oo aan caadi ahayn iyada oo loo marayo sii deynta iyo qaadashada GPT-3, Shabakada Guud ee Kala-saareyaasha Guud (GAN) waxay noqotay summad la aqoonsan karo oo iskeed u taagan, oo laga yaabo inay ugu dambayn ku biirto qoto dheer fal ahaan.

Marka hore la soo jeediyay in 2014 oo ugu horrayn loo isticmaalo sawir-samaynta, Shabakadda Adversarial Generative naqshadaha wuxuu ka kooban yahay a Generator iyo a Takoorka. Generator-ku waxa uu wareegaa kumanaan sawiro ah oo ku jira xog-ururin, isaga oo si isdaba joog ah isku dayaya in uu dib u dhiso. Isku day kasta, Takoorku wuxuu qiimeeyaa shaqada Generator-ka, wuxuuna dib u soo celiyaa koronto-dhaliyaha si uu u sii wanajiyo, laakiin iyada oo aan wax fikrad ah laga helin qaabkii dib-u-dhiskii hore u khalday.

Xigasho: https://developers.google.com/machine-learning/gan/gan_structure

Xigasho: https://developers.google.com/machine-learning/gan/gan_structure

Tani waxay ku khasbaysaa Koronto-dhaliyaha inuu sahamiyo waddooyin badan, halkii uu raaci lahaa luuqyada indho la'aanta ah ee ka dhalan lahaa haddii Takoorku u sheegi lahaa halka ay ka khaldan tahay (eeg #8 ee hoose). Marka uu tababarku dhammaado, Generator-ku waxa uu leeyahay khariidad faahfaahsan oo dhammaystiran oo xidhiidhada u dhexeeya dhibcaha xogta.

Qayb ka mid ah fiidyowga la socda cilmi-baarayaasha (eeg lifaaqa dhammaadka maqaalka). Ogsoonow in isticmaaluhu uu isbeddellada ku maamulayo calaamad 'qabso' (bidix sare). Xigasho: https://www.youtube.com/watch?v=k7sG4XY5rIc

Laga soo bilaabo warqadda Hagaajinta dheellitirka GAN iyadoo kor loo qaadayo wacyigelinta meelaha: qaab-dhismeedka sheeko cusub ayaa wareegtaya meeraha dahsoon ee mararka qaarkood-daahsoon ee GAN, isaga oo siinaya qalab wax ku ool ah oo loogu talagalay qaab-dhismeedka isku-dhafka sawirka. Xigasho: https://genforce.github.io/eqgan/

Marka la barbardhigo, tani waa farqiga u dhexeeya barashada hal safar oo humdrum ah ilaa bartamaha London, ama si xamaasad leh u hesho. Aqoonta.

Natiijadu waa ururin heer sare ah oo sifooyin ah oo ku yaal meesha qarsoon ee qaabka la tababaray. Tilmaamaha semantic ee sifada heerka sare waxay noqon kartaa 'qof', halka ka soo degid gaar ah oo la xidhiidha sifada laga yaabo inay soo saarto sifooyin kale oo la bartay, sida 'lab' iyo 'dheddig'. Heerarka hoose ayaa sifooyin hoosaadyadu u kala jabi karaan, 'blonde', 'Caucasian', et al.

Isku-duubnidu waa arrin xusid mudan Meesha qarsoon ee GAN-yada iyo qaab-dhismeedka codeer/qalab-samaynta: Dhoola-cadaynta wejiga dheddigga ee GAN ma tahay sifo isku xidhan oo ah 'aqoonsigeeda' ee bannaanka qarsoon, mise waa laan barbar socota?

Wajiyada GAN ay soo saartay oo ka socda qofkan aqoon-yahanka. Xigasho: https://this-person-does-not-exist.com/en

Wajiyada GAN ay soo saartay oo ka socda qofkan aqoon-yahanka. Xigasho: https://this-person-does-not-exist.com/en

Labadii sano ee la soo dhaafay waxay keeneen tiro sii kordheysa oo ah dadaallo cilmi baaris oo cusub oo arrintan ku saabsan, laga yaabee inay u gogol xaarto heer-muuqaal, tafatirka qaabka Photoshop ee booska qarsoon ee GAN, laakiin xilligan, isbeddello badan ayaa si wax ku ool ah u leh ' baakadaha oo dhan ama waxba. Gaar ahaan, NVIDIA's EditGAN sii deynta dabayaaqadii 2021 waxay gaadhay a heerka sare ee fasiraada meel bannaan oo qarsoon adigoo isticmaalaya waji-xidhaha kala-saarista semantic.

Isticmaalka caanka ah

Marka laga soo tago ku lug lahaanshahooda (dhab ahaantii si cadaalad ah u xaddidan) ee fiidiyowyada qoto dheer ee caanka ah, GAN-yada muuqaalka/muuqaalku xuddun u ah ayaa batay afartii sano ee la soo dhaafay, taas oo soo jiidatay cilmi-baarayaasha iyo dadweynaha si isku mid ah. La socoshada heerka wareerka iyo inta jeer ee sii daynta cusub waa caqabad, in kastoo kaydka GitHub Codsiyada GAN ee cajiibka ah ujeedadeedu tahay inay bixiso liis dhamaystiran.

Hal-abuurnimada Shabakadda Adversarial waxay aragti ahaan ka soo saari karaan astaamo meel kasta oo si wanaagsan loo qaabeeyey, oo ay ku jiraan qoraalka.

3: SVM

Asal ahaan in 1963, Taageerada Mashiinka Vector (SVM) waa algorithm-ka aasaasiga ah oo si joogta ah ugu soo baxa cilmi-baaris cusub. Hoosta SVM, vectors waxay khariidadeeyaan hab-dhaqanka dhibcaha xogta ee kaydka xogta, halka taageero vectors ayaa qeexaya xuduudaha u dhexeeya kooxo, astaamo, ama astaamo kala duwan.

Qaybaha taageerada ayaa qeexaya xuduudaha u dhexeeya kooxaha. Isha: https://www.kdnuggets.com/2016/07/support-vector-machines-simple-explanation.html

Qaybaha taageerada ayaa qeexaya xuduudaha u dhexeeya kooxaha. Isha: https://www.kdnuggets.com/2016/07/support-vector-machines-simple-explanation.html

Soohdinta la soo saaray waxaa loo yaqaan a dayaarad sare.

Heerarka astaamaha hoose, SVM waa laba-cabbir (sawirka kore), laakiin halka ay jiraan tiro sare oo la aqoonsan yahay oo kooxo ah ama noocyo ah, waxay noqotaa saddex-cabbir.

Dhibco iyo kooxo qoto dheer ayaa u baahan SVM saddex-geesood ah. Xigasho: https://cml.rhul.ac.uk/svm.html

Dhibco iyo kooxo qoto dheer ayaa u baahan SVM saddex-geesood ah. Xigasho: https://cml.rhul.ac.uk/svm.html

Isticmaalka caanka ah

Maadaama taageerada Mashiinnada Vector-ka ay si wax ku ool ah oo caqli-gal ah wax uga qaban karaan xogta cabbirka sare leh ee noocyo badan, waxay si ballaaran uga soo baxeen qaybaha kala duwan ee barashada mashiinka, oo ay ku jiraan ogaanshaha qoto dheer, kala soocidda sawirka, kala saarista hadalka nacaybka, Falanqaynta DNA iyo saadaasha qaab dhismeedka dadweynaha, Kuwo kale oo badan.

4: K-Waxaa loola jeedaa Kutlada

Kooxdu guud ahaan waa a waxbarashada aan la ilaalin habka doonaya in loo kala saaro dhibcaha xogta iyada oo loo marayo qiyaasta cufnaanta, samaynta khariidad qaybinta xogta la daraaseeyo.

K-Waxaa loola jeedaa ururinta qaybaha ilaahnimada, kooxaha iyo bulshada xogta. Xigasho: https://aws.amazon.com/blogs/machine-learning/k-means-clustering-with-amazon-sagemaker/

K-Waxaa loola jeedaa ururinta qaybaha ilaahnimada, kooxaha iyo bulshada xogta. Xigasho: https://aws.amazon.com/blogs/machine-learning/k-means-clustering-with-amazon-sagemaker/

K-Waxaa loola jeedaa Kutlada waxay noqotay hirgelinta habkan ugu caansan, xogta adhijirku waxay tilmaamaysaa 'Kooxaha K' ee gaarka ah, kuwaas oo muujin kara qaybaha tirakoobka, bulshooyinka khadka tooska ah, ama ururinta sirta ah ee kale ee suurtogalka ah ee sugaya in lagu ogaado xogta tirakoobka cayriin.

Kooxuhu waxay ku sameeyaan falanqaynta K-Means. Xigasho: https://www.geeksforgeeks.org/ml-determine-the-optimal-value-of-k-in-k-means-clustering/

Kooxuhu waxay ku sameeyaan falanqaynta K-Means. Xigasho: https://www.geeksforgeeks.org/ml-determine-the-optimal-value-of-k-in-k-means-clustering/

Qiimaha K laftiisa ayaa ah qodobka go'aamiya ka faa'iidaysiga habka, iyo samaynta qiimaha ugu fiican ee kooxdu. Markii hore, qiimaha K waxa loo qoondeeyay si aan kala sooc lahayn, iyo sifooyinkeeda iyo astaamaha vector marka la barbar dhigo deriskeeda. Deriska sida aadka ah ugu shabaha barta xogta leh qiimaha aan kala sooc lahayn ayaa loo qoondeeyaa kutlada si isdaba joog ah ilaa xogtu ay ka soo baxdo dhammaan kooxaha uu nidaamku oggol yahay.

Qorshaha qaladka labajibaaran yahay, ama 'qiimaha' ee qiyamka kala duwan ee kooxuhu waxay muujinayaan a barta xusulka xogta:

'Barta xusulka' ee garaaf kooxeedka Isha: https://www.scikit-yb.org/en/latest/api/cluster/elbow.html

'Barta xusulka' ee garaaf kooxeedka Isha: https://www.scikit-yb.org/en/latest/api/cluster/elbow.html

Barta xusulku waxay la mid tahay fikradda habka uu khasaaruhu u soo baxayo soo laabashada yaraynta dhammaadka casharka xogta xogta. Waxay ka dhigan tahay meesha aysan muuqan wax kala duwanaansho dheeraad ah oo u dhexeeya kooxaha, taasoo muujinaysa xilliga loo gudbayo wejiyada xiga ee dhuumaha xogta, ama haddii kale la soo sheego natiijooyinka.

Isticmaalka caanka ah

K-Means Clustering, sababo muuqda dartood, waa tignoolajiyada aasaasiga ah ee falanqaynta macaamiisha, maadaama ay bixiso hab cad oo la macnayn karo si loogu turjumo tiro badan oo diiwaanno ganacsi ah aragtiyo tirakoobka iyo 'hogaanka'.

Codsigan ka baxsan, K-Means Clustering ayaa sidoo kale loo shaqaaleysiiyay saadaasha dhul go'a, kala qaybinta sawirka caafimaadka, isku dhafka sawirka ee GANs, kala soocidda dukumentiyada, Iyo qorsheynta magaalada, iyo kuwo kale oo badan oo suurtagal ah iyo isticmaalka dhabta ah.

5: Kaynta Random

Kaymaha Random waa a ururinta waxbarashada habka celceliska natiijada ka soo diyaarshay of geedaha go'aanka si loo sameeyo saadaalin guud oo natiijada.

Isha: https://www.tutorialandexample.com/wp-content/uploads/2019/10/Decision-Trees-Root-Node.png

Isha: https://www.tutorialandexample.com/wp-content/uploads/2019/10/Decision-Trees-Root-Node.png

Haddii aad baadhisay xataa in yar sida daawashada Back to Mustaqbalka trilogy, geedka go'aanka laftiisa ayaa si fudud u fudud in la fahmo: dhowr waddo ayaa hortaada yaal, dariiq kastana wuxuu soo saaraa natiijo cusub taas oo ka kooban wadooyin kale oo suurtagal ah.

In barashada xoojinta, waxaa laga yaabaa inaad ka laabato dariiqa oo aad mar kale ka bilowdo mawqifkii hore, halka geedaha go'aannada ay go'aansadaan safarradooda.

Sidaa darteed Algorithm kaynta Random Forest asal ahaan waa sharadka go'aamada. Algorithm-ka waxaa loo yaqaan 'random' sababtoo ah wuu sameeyaa ad hoc xulashooyin iyo indho-indhayn si loo fahmo dhexdhexaad wadarta natiijada ka soo baxda geedka go'aanka.

Maadaama ay tixgalinayso dhawr arrimood, habka Random Forest way aad u adkaan kartaa in loo beddelo garaafyo macno leh marka loo eego geedka go'aanka, laakiin waxay u badan tahay inay si gaar ah waxtar u leedahay.

Geedaha go'aanku waxay ku xiran yihiin si xad dhaaf ah, halkaasoo natiijooyinka la helay ay yihiin kuwo xog gaar ah oo aan loo badneyn in la soo koobo. Xulashada aan loo meel dayin ee kaynta Random Forest ee dhibcaha xogta waxay la dagaalanto u janjeersigan, iyada oo la qodayo si macno leh oo waxtar leh isbeddellada wakiillada ee xogta.

Dib-u-noqoshada geedka go'aanka. Isha: https://scikit-learn.org/stable/auto_examples/tree/plot_tree_regression.html

Dib-u-noqoshada geedka go'aanka. Isha: https://scikit-learn.org/stable/auto_examples/tree/plot_tree_regression.html

Isticmaalka caanka ah

Sida qaar badan oo ka mid ah algorithms-yada ku jira liiskan, Random Forest waxay caadi ahaan u shaqeysaa sidii kala soocida hore iyo shaandhaynta xogta, iyo sida oo kale waxay si joogto ah ugu soo baxdaa waraaqo cilmi baaris oo cusub. Tusaalooyinka qaarkood ee isticmaalka Kaymaha Random waxaa ka mid ah Samaynta Sawirka Resonance Magnetic, Saadaalinta qiimaha Bitcoin, qaybinta tirakoobka, kala soocidda qoraalka iyo ogaanshaha khayaanada kaarka deynta.

Maadaama Random Forest uu yahay algorithm-hooseeya ee naqshadaha barashada mashiinka, waxay sidoo kale gacan ka geysan kartaa waxqabadka hababka kale ee hooseeya, iyo sidoo kale algorithms aragga, oo ay ku jiraan Kutlada Inductive, Isbeddellada Muuqaalka, kala soocidda dukumentiyada qoraalka ah iyadoo la isticmaalayo sifooyin yar, Iyo Tubooyinka Tubooyinka.

6: Naive Bayes

Oo lagu daray qiyaasta cufnaanta (eeg 4, kor), a nacas Bayes kala saaruhu waa algorithm awood leh laakiin miisaan yar oo awood u leh inuu qiyaaso ixtimaalka ku salaysan sifooyinka la xisaabiyay ee xogta.

Astaamaha xiriirka ee kala soocida Bayes naive. Xigasho: https://www.sciencedirect.com/topics/computer-science/naive-bayes-model

Astaamaha xiriirka ee kala soocida Bayes naive. Xigasho: https://www.sciencedirect.com/topics/computer-science/naive-bayes-model

Erayga 'naif' waxaa loola jeedaa malo-awaalka gudaha Aragtida Bayes sifooyinkaas oo aan xidhiidh la lahayn, loo yaqaan madaxbannaani shuruudaysan. Haddii aad qaadato aragtidan, u socoshada iyo u hadalka sida shinbiraha kuma filna in la caddeeyo in aanu la tacaaleyno shinbiraha, mana jirto malo 'cad' ah oo si degdeg ah loo qaatay.

Heerkan tacliimeed iyo adagaanta baadhistu waxay noqon doontaa mid aad u liidata halka 'caqliga guud' laga heli karo, laakiin waa halbeeg qiimo leh marka la marayo madmadowga badan iyo isku xirnaanta suurtagalka ah ee aan xiriir la lahayn ee ka dhex jira xogta barashada mashiinka.

Shabakadda asalka ah ee Bayesian, sifada ayaa ku xiran hawlaha gooldhalinta, oo ay ku jiraan dhererka sharaxaadda ugu yar iyo Bayesian gooldhalinta, kaas oo ku soo rogi kara xaddidaadda xogta marka la eego isku xirka la qiyaasay ee laga helay dhibcaha xogta, iyo jihada ay u socdaan xiriiradaasi.

Kala soocida Bayes naive, liddi ku ah, waxay ku shaqeysaa iyada oo loo maleynayo in astaamaha shayga la bixiyay ay madax bannaan yihiin, ka dib iyadoo la adeegsanayo aragtida Bayes si loo xisaabiyo itimaalka shay la bixiyay, iyadoo lagu saleynayo sifooyinkiisa.

Isticmaalka caanka ah

filtarrada Naive Bayes si wanaagsan ayaa loogu matalay gudaha saadaalinta cudurka iyo kala soocidda dukumentiyada, shaandhaynta spam, kala saaridda dareenka, nidaamyada la-talinta, Iyo ogaanshaha khiyaanada, iyo codsiyada kale.

7: K- Deriska kuugu dhow (KNN)

Marka hore waxaa soo jeediyay Dugsiga Ciidanka Cirka ee Mareykanka ee Caafimaadka Duulista in 1951, iyo in ay is waafajiso qalabka casriga ah ee bartamihii qarnigii 20aad ee kombuyuutarada, K- Deriska Ugu Dhaw (KNN) waa algorithm caato ah oo wali si muuqata uga muuqda warqadaha akadeemiyada iyo dadaallada cilmi baarista mashiinka qaybta gaarka ah.

KNN waxaa loogu yeeraa 'barteha caajiska ah', maadaama ay si buuxda u baarto xog-ururin si ay u qiimeyso xiriirka ka dhexeeya dhibcaha xogta, halkii ay u baahnaan lahayd tababbarka qaabka barashada mashiinka buuxa.

Kooxda KNN Isha: https://scikit-learn.org/stable/modules/neighbors.html

Kooxda KNN Xigasho: https://scikit-learn.org/stable/modules/neighbors.html

In kasta oo KNN ay qaab dhismeed ahaan caato tahay, habkeeda habaysan ayaa keenaya baahi muuqata oo la xiriirta wax-akhrinta/qorista, adeegsigeeda xog-ururinta aad u weyna waxay noqon kartaa dhibaato la'aanteed tignoolajiyada isku dhafan sida Falanqaynta Qaybaha Maamulaha (PCA), kaas oo beddeli kara xog-ururin adag iyo mugga sare. galay kooxaynta wakiillada in KNN ay ku mari karto dadaal yar.

A daraasad dhawaan waxay qiimeeyeen waxtarka iyo dhaqaalaha tiro algorithms ah oo loo xilsaaray inay saadaaliyaan in shaqaaluhu ka tagi doono shirkad, isagoo ogaanaya in septuagenarian KNN uu weli ka sarreeyo tartamayaasha casriga ah marka loo eego saxnaanta iyo waxtarka saadaalinta.

Isticmaalka caanka ah

Dhammaan fududaynta caanka ah ee fikradda iyo fulinta, KNN kuma xirna 1950-meeyadii – waxaa la waafajiyay hab badan oo diiradda saaraya DNS soo jeedinta 2018 ee Jaamacadda Gobolka Pennsylvania, oo weli ah habka dhexe ee marxaladda hore (ama qalab gorfaynta ka dib) ee qaabab barasho mashiinka oo aad u adag.

Habaynyo kala duwan, KNN ayaa loo isticmaalay ama loogu talagalay xaqiijinta saxiixa online, kala soocidda sawirka, qoraalka macdanta, saadaasha dalagga, Iyo aqoonsiga wajiga, ka sokow codsiyada kale iyo ku darida.

Nidaamka aqoonsiga wejiga ee ku saleysan KNN ee tababarka. Xigasho: https://pdfs.semanticscholar.org/6f3d/d4c5ffeb3ce74bf57342861686944490f513.pdf

Nidaamka aqoonsiga wejiga ee ku saleysan KNN ee tababarka. Source: https://pdfs.semanticscholar.org/6f3d/d4c5ffeb3ce74bf57342861686944490f513.pdf

8: Habka Go'aanka Markov (MDP)

Qaab-dhismeedka xisaabeed ee uu soo bandhigay xisaabyahan Maraykan ah Richard Bellman in 1957Habka Go'aanka Markov (MDP) waa mid ka mid ah baloogyada aasaasiga ah ee barashada xoojinta naqshadaha. Algorithm-ka fikradeed ee iskeed u gaar ah, waxa lagu habeeyey tiro aad u badan oo algorithms-yada kale ah, oo si joogto ah ugu soo noqnoqda dalagga hadda jira ee cilmi-baarista AI/ML.

MDP waxay sahamisaa bay'ada xogta iyadoo adeegsanaysa qiimaynta xaaladeeda hadda (ie 'meesha' ay xogta ku jirto) si ay u go'aamiso udubka xogta si ay u sahamiso xiga.

Xigasho: https://www.sciencedirect.com/science/article/abs/pii/S0888613X18304420

Xigasho: https://www.sciencedirect.com/science/article/abs/pii/S0888613X18304420

Habka Go'aanka aasaasiga ah ee Markov ayaa mudnaanta siin doona faa'iidada mustaqbalka dhow ujeedooyinka fog ee la jecel yahay. Sababtan awgeed, badanaa waxay ku dhex jirtaa macnaha guud ee qaab-dhismeedka siyaasadda ee xoojinta waxbarashada, waxayna inta badan ku xiran tahay arrimo xaddidan sida abaal-marin la dhimay, iyo wax ka beddelka doorsoomayaasha deegaanka ee ka ilaalin doona in ay ku degdegto hadaf degdeg ah iyada oo aan la tixgalinin natiijada la rabo ee ballaaran.

Isticmaalka caanka ah

Fikradda heerka hoose ee MDP waxay ku baahsan tahay cilmi-baarista iyo hawlgelinta firfircoon ee barashada mashiinka. Waxaa loo soo jeediyay Nidaamyada difaaca amniga IoT, goosashada kalluunka, Iyo saadaalinta suuqa.

Ka sokow keeda ku habboonaansho cad shaxanka iyo ciyaaraha kale ee sida adag u xidhiidhsan, MDP sidoo kale waa tartan dabiici ah tababbarka habraaca ee hababka robotics-ka, sida aan ka arki karno muuqaalka hoose.

Qorsheeyaha Caalamiga ah oo isticmaalaya Habka Go'aanka Markov - Robotics Warshadaha Mobile

 

9: Soo noqnoqoshada muddada-soo noqnoqoshada dukumeentiga

Inta jeer ee muddada (TF) wuxuu u qaybiyaa tirada jeer ee uu kelmad ka soo muuqdo dukumeentiga wadarta guud ee erayada dukumeentigaas. Sidaa darteed ereyga seal ka soo muuqda hal mar maqaal kun-erey waxa uu leeyahay inta jeer ee ereyada 0.001. Laftigeeda, TF inta badan faa'iido ma leh sida tilmaame muhiimadda ereyga, sababtoo ah xaqiiqda maqaallada aan macnaha lahayn (sida a, iyo, ka, Iyo it) ugu badnaan.

Si loo helo qiimo macne leh ereyga, Soo noqnoqoshada Dukumeentiga Inverse (IDF) waxay ku xisaabisaa TF ee erayga dhammaan dukumeentiyo badan oo ku jira xog-ururin, iyada oo ku meelaynaysa qiimeyn hoose oo aad u sarreeya. ereyada joojinta, sida maqaallada. Natiijadu waxay ka soo baxdaa calaamad muujinaysa qiyamka oo dhan, iyadoo kelmad kastaa loo qoondeeyay miisaan ku habboon.

TF-IDF waxay miisaamaysaa ku habboonaanta ereyada ku salaysan soo noqnoqoshada tiro dukumeenti ah, iyadoo ay dhif iyo naadir tahay tusaha salience. Xigasho: https://moz.com/blog/inverse-document-frequency-and-the-importance-of-uniqueness

TF-IDF waxay miisaamaysaa ku habboonaanta ereyada ku salaysan soo noqnoqoshada tiro dukumeenti ah, iyadoo ay dhif iyo naadir tahay tusaha salience. Xigasho: https://moz.com/blog/inverse-document-frequency-and-the-importance-of-uniqueness

Inkasta oo habkani uu ka hortagayo ereyada macno ahaan muhiimka ah inay lumaan sida dibad baxayaasha, rogida miisaanka soo noqnoqda si toos ah macnaheedu maaha in erey-soo noqnoqda hoose yahay ma ka baxsan, sababtoo ah waxyaabaha qaarkood waa dhif iyo aan qiimo lahayn. Sidaa darteed ereyga soo noqnoqda hooseeya wuxuu u baahan doonaa inuu caddeeyo qiimaha uu ku leeyahay macnaha guud ee qaabdhismeedka iyadoo lagu muujinayo (xitaa inta jeer ee hooseeya dukumeenti kasta) tiro dukumeenti ah oo ku jira xogta.

In kasta oo ay da'da, TF-IDF waa hab xoog badan oo caan ah oo loogu talagalay kaadhka shaandhaynta bilowga ah ee qaababka Habaynta Luuqadda Dabiiciga ah.

Isticmaalka caanka ah

Sababtoo ah TF-IDF waxay ka ciyaartay ugu yaraan qayb ka mid ah horumarinta Google's inta badan occult PageRank algorithm labaatankii sano ee la soo dhaafay, waxay noqotay si weyn loo korsaday sidii xeelad SEO ah oo wax-ku-ool ah, in kasta oo uu jiro John Mueller's 2019 diidmo muhiimadda ay u leedahay natiijooyinka raadinta.

Sirta ku xeeran PageRank awgeed, ma jirto caddayn cad oo ah in TF-IDF ay tahay ma hadda waa xeelad wax ku ool ah oo kor loogu qaadayo qiimaynta Google. Hurin dood Xirfadlayaasha IT ka mid ah beryahan dambe waxay muujinayaan fahamka caanka ah, sax ama maya, ereygaas xad-gudubku wuxuu wali keeni karaa meelaynta SEO oo la hagaajiyay (in kasta oo dheeraad ah eedeymaha xadgudubka monopoly iyo xayaysiis xad dhaaf ah blur xuduudaha aragtidan).

10: Hoos-u-dhaca Stochastic Gradient

Hoos udhaca Stochastic Gradient (SGD) waa hab sii kordheysa oo caan ah oo lagu wanaajinayo tababarka moodooyinka barashada mashiinka.

Hoos-u-dhaca Gradient lafteedu waa hab lagu wanaajiyo oo dabadeed lagu qiyaaso horumarka uu model-ku samaynayo muddada tababarka.

Dareenkan, 'gradient' wuxuu muujinayaa jiirar hoos u dhac ah (halkii aad ka heli lahayd shahaadada midabka ku salaysan, eeg sawirka hoose), halkaasoo meesha ugu sarreysa ee 'buur', ee bidixda, u taagan tahay bilowga habka tababarka. Marxaladdan qaabku weli ma uusan arkin dhammaan xogta xitaa hal mar, mana uusan baranin ku filan xiriirka ka dhexeeya xogta si loo soo saaro isbeddel wax ku ool ah.

Hoos u dhac tartiib ah oo ku saabsan fadhiga tababarka FaceSwap. Waxaan arki karnaa in tababarku uu aad u fiicnaaday in muddo ah qeybtii labaad, laakiin ugu dambeyntii uu ka soo kabtay hoos u dhac ku yimid isu-imaatin la aqbali karo.

Hoos u dhac tartiib ah oo ku saabsan fadhiga tababarka FaceSwap. Waxaan arki karnaa in tababarku uu aad u fiicnaaday in muddo ah qeybtii labaad, laakiin ugu dambeyntii uu ka soo kabtay hoos u dhac ku yimid isu-imaatin la aqbali karo.

Meesha ugu hooseysa, dhanka midig, waxay ka dhigan tahay isku-duubnida (barta uu qaabku yahay mid wax ku ool ah sida uu waligiis u hoos gelayo xannibaadaha iyo goobaha la soo rogay).

Gradient-ku wuxuu u shaqeeyaa sidii rikoodh iyo saadaaliye farqiga u dhexeeya heerka khaladka (sida saxda ah ee moodeelku hadda u khariideeyay cilaaqaadka xogta) iyo miisaanka (goobyada saameeya habka uu tusaaluhu u baran doono).

Diiwaankan horumarka waxa loo isticmaali karaa in lagu wargeliyo a jadwalka heerka waxbarashada, Hannaan toos ah oo u sheegaya naqshad-dhismeedku inuu noqdo mid aad u kooban oo sax ah marka tafaasiisha hore ee aan caddayn isu beddesho xidhiidhyo cad iyo khariidado. Dhaqan ahaan, luminta gradient-ku waxay bixisaa khariidad-waqtiga saxda ah ee meesha tababarku ku xigi doono, iyo sida uu u socdo.

Hal-abuurka Stochastic Gradient Deescent waa in ay cusboonaysiiso cabbirka tusaalaha ee tusaalaha tababbarka kasta ee soo noqnoqda, kaas oo guud ahaan dedejiya safarka isku-xidhka. Sababo la xiriira imaanshaha xog-ururinta xog-ururinta sannadihii la soo dhaafay, SGD waxa ay caan ku noqotay beryahan dambe sida hal hab oo suurtagal ah oo wax looga qabanayo arrimaha saadka ee soo socda.

Dhanka kale, SGD waxay leedahay saamayn taban si loo miisaamo muuqaalka, waxaana laga yaabaa inay u baahato ku celcelin dheeraad ah si loo gaaro natiijo isku mid ah, oo u baahan qorshayn dheeri ah iyo cabbiraadyo dheeri ah, marka la barbar dhigo Faraca caadiga ah.

Isticmaalka caanka ah

Habaynteeda awgeed, iyo in kasta oo ay liidato, SGD waxay noqotay algorithm-ka ugu caansan ee ku habboon shabakadaha neerfaha. Mid ka mid ah qaabeynta SGD ee ku noqonaysa mid ku weyn waraaqaha cusub ee cilmi-baarista AI/ML waa doorashada Qiyaasta Xilliga La Qabsiga (ADAM, oo la soo bandhigay) in 2015) hagaajin.

ADAM waxay u qabataa heerka barashada halbeeg kasta si firfircooni leh ('qiimaynta barashada la qabsiga'), iyo sidoo kale ku darista natiijooyinka cusboonaysiinta hore qaabaynta soo socota Intaa waxaa dheer, waxaa loo habeyn karaa in loo isticmaalo hal-abuurnimada dambe, sida Nesterov Momentum.

Si kastaba ha ahaatee, qaar ayaa ku adkeysanaya in isticmaalka xawliga uu sidoo kale dedejin karo ADAM (iyo algorithms la mid ah) ilaa a gabagabo hoose. Sida inta badan cidhifka dhiig-baxa ee qaybta cilmi-baarista barashada mashiinka, SGD waa shaqo socota.

 

Markii ugu horreysay waxaa la daabacay 10-kii Febraayo 2022. Wax laga beddelay 10-kii Febraayo 20.05 EET - qaabeynta.