peň Čo je strojové učenie? - Spojte sa.AI
Spojte sa s nami
Masterclass AI:

AI 101

Čo je to strojové učenie?

mm
Aktualizované on

Strojové učenie je jednou z najrýchlejšie rastúcich technologických oblastí, no napriek tomu, ako často sa slová „strojové učenie“ prehadzujú, môže byť ťažké presne pochopiť, čo strojové učenie je.

Strojové učenie neoznačuje len jednu vec, je to zastrešujúci termín, ktorý možno použiť na mnoho rôznych konceptov a techník. Pochopiť strojové učenie znamená poznať rôzne formy modelovej analýzy, premenné a algoritmy. Pozrime sa bližšie na strojové učenie, aby sme lepšie pochopili, čo zahŕňa.

Čo je strojové učenie?

Zatiaľ čo pojem strojové učenie možno použiť na mnoho rôznych vecí, vo všeobecnosti sa tento pojem vzťahuje na umožnenie počítaču vykonávať úlohy bez toho, aby na to dostával explicitné pokyny riadok po riadku. Špecialista na strojové učenie nemusí vypisovať všetky kroky potrebné na vyriešenie problému, pretože počítač sa dokáže „učiť“ analýzou vzorcov v údajoch a zovšeobecnením týchto vzorov na nové údaje.

Systémy strojového učenia majú tri základné časti:

  • Vstupy
  • Algoritmy
  • Výstupy

Vstupy sú údaje, ktoré sa vkladajú do systému strojového učenia, a vstupné údaje možno rozdeliť na štítky a funkcie. Funkcie sú relevantné premenné, premenné, ktoré sa budú analyzovať, aby sme sa naučili vzorce a vyvodili závery. Medzitým sú označenia triedy/popisy priradené jednotlivým inštanciám údajov.

Funkcie a štítky možno použiť v dvoch rôznych typoch problémov strojového učenia: učenie pod dohľadom a učenie bez dozoru.

Učenie bez dozoru vs. vyučovanie pod dohľadom

In učenie pod dohľadom, vstupné údaje sú sprevádzané základnou pravdou. Problémy s riadeným učením majú správne výstupné hodnoty ako súčasť súboru údajov, takže očakávané triedy sú vopred známe. To umožňuje vedcom údajov skontrolovať výkonnosť algoritmu testovaním údajov na súbore testovacích údajov a zisťovaním, aké percento položiek bolo správne klasifikovaných.

Na rozdiel od toho, učenie bez dozoru problémy nemajú nálepky základnej pravdy. Algoritmus strojového učenia vyškolený na vykonávanie úloh učenia bez dozoru musí byť schopný odvodiť príslušné vzorce v údajoch pre seba.

Algoritmy učenia pod dohľadom sa zvyčajne používajú pri problémoch s klasifikáciou, kde je k dispozícii veľký súbor údajov naplnený inštanciami, ktoré je potrebné triediť do jednej z mnohých rôznych tried. Ďalším typom kontrolovaného učenia je regresná úloha, kde výstup hodnoty algoritmom má spojitý charakter, nie kategorický.

Medzitým sa algoritmy učenia bez dozoru používajú na úlohy, ako je odhad hustoty, zhlukovanie a učenie reprezentácie. Tieto tri úlohy potrebujú model strojového učenia na odvodenie štruktúry údajov, model nemá žiadne preddefinované triedy.

Poďme sa stručne pozrieť na niektoré z najbežnejších algoritmov používaných v učení bez dozoru aj pri učení pod dohľadom.

Typy kontrolovaného učenia

Bežné algoritmy učenia pod dohľadom zahŕňajú:

  • Naivný Bayes
  • Podpora vektorové stroje
  • Logistická regresia
  • Náhodné lesy
  • Umelé neurónové siete

Podpora vektorové stroje sú algoritmy, ktoré rozdeľujú množinu údajov do rôznych tried. Dátové body sú zoskupené do zhlukov nakreslením čiar, ktoré oddeľujú triedy od seba. Body nájdené na jednej strane čiary budú patriť do jednej triedy, zatiaľ čo body na druhej strane čiary sú inej triedy. Cieľom podporných vektorových strojov je maximalizovať vzdialenosť medzi čiarou a bodmi nachádzajúcimi sa na oboch stranách čiary a čím väčšia je vzdialenosť, tým je klasifikátor istejší, že bod patrí do jednej triedy a nie do inej triedy.

Logistická regresia je algoritmus používaný v úlohách binárnej klasifikácie, keď dátové body musia byť klasifikované ako patriace do jednej z dvoch tried. Logistická regresia funguje tak, že sa dátový bod označí buď 1 alebo 0. Ak je vnímaná hodnota dátového bodu 0.49 alebo nižšia, je klasifikovaná ako 0, zatiaľ čo ak je 0.5 alebo vyššia, je klasifikovaná ako 1.

Algoritmy rozhodovacieho stromu fungujú tak, že množiny údajov rozdeľujú na menšie a menšie fragmenty. Presné kritériá použité na rozdelenie údajov závisia od inžiniera strojového učenia, ale cieľom je nakoniec rozdeliť údaje do jednotlivých údajových bodov, ktoré sa potom klasifikujú pomocou kľúča.

Algoritmus náhodného lesa je v podstate veľa jednotlivých klasifikátorov rozhodovacieho stromu spojených do výkonnejšieho klasifikátora.

Naivný Bayesov klasifikátor vypočíta pravdepodobnosť, že k danému dátovému bodu došlo, na základe pravdepodobnosti výskytu predchádzajúcej udalosti. Je založený na Bayesovej vete a umiestňuje dátové body do tried na základe ich vypočítanej pravdepodobnosti. Pri implementácii klasifikátora Naive Bayes sa predpokladá, že všetky prediktory majú rovnaký vplyv na výsledok triedy.

An Umelá neurónová sieť, alebo viacvrstvový perceptrón, sú algoritmy strojového učenia inšpirované štruktúrou a funkciou ľudského mozgu. Umelé neurónové siete dostali svoj názov podľa skutočnosti, že sú vytvorené z mnohých uzlov/neurónov navzájom prepojených. Každý neurón manipuluje s údajmi pomocou matematickej funkcie. V umelých neurónových sieťach existujú vstupné vrstvy, skryté vrstvy a výstupné vrstvy.

Skrytá vrstva neurónovej siete je miestom, kde sa údaje skutočne interpretujú a analyzujú na vzory. Inými slovami, je to miesto, kde sa algoritmus učí. Viac neurónov spojených dohromady vytvára zložitejšie siete schopné učiť sa zložitejšie vzorce.

Typy učenia bez dozoru

Algoritmy učenia bez dozoru zahŕňajú:

  • K-znamená zhlukovanie
  • Automatické kódovače
  • Analýza hlavných komponentov

K-znamená zhlukovanie je technika klasifikácie bez dozoru a funguje tak, že body údajov rozdeľuje do zhlukov alebo skupín na základe ich vlastností. Klastrovanie K-means analyzuje vlastnosti nachádzajúce sa v dátových bodoch a rozlišuje v nich vzory, vďaka ktorým sú dátové body nájdené v klastri danej triedy navzájom podobnejšie, než sú klastre obsahujúce iné dátové body. To sa dosiahne umiestnením možných stredov klastra alebo ťažísk do grafu údajov a opätovným priradením polohy ťažiska, kým sa nenájde poloha, ktorá minimalizuje vzdialenosť medzi ťažiskom a bodmi, ktoré patria do triedy tohto ťažiska. Výskumník môže špecifikovať požadovaný počet zhlukov.

Analýza hlavných komponentov je technika, ktorá redukuje veľké množstvo funkcií/premenných na menší priestor funkcií/menej funkcií. „Hlavné komponenty“ údajových bodov sa vyberú na uchovanie, zatiaľ čo ostatné funkcie sú stlačené do menšej reprezentácie. Vzťah medzi pôvodnými dátovými elixírmi je zachovaný, ale keďže zložitosť dátových bodov je jednoduchšia, dáta sa ľahšie kvantifikujú a popisujú.

Automatické kódovače sú verzie neurónových sietí, ktoré je možné použiť na učebné úlohy bez dozoru. Autokodéry sú schopné prijímať neoznačené údaje vo voľnom formáte a transformovať ich na údaje, ktoré je schopná použiť neurónová sieť, v podstate vytvárajú svoje vlastné označené trénovacie údaje. Cieľom automatického kódovača je konvertovať vstupné údaje a prebudovať ich čo najpresnejšie, takže je v motivácii siete určiť, ktoré funkcie sú najdôležitejšie, a extrahovať ich.

Bloger a programátor so špecializáciou v Strojové učenie a Deep Learning témy. Daniel dúfa, že pomôže ostatným využívať silu AI pre sociálne dobro.