výhonek Co je strojové učení? - Spojte se.AI
Spojte se s námi
Mistrovská třída AI:

AI 101

Co je strojové učení?

mm
aktualizováno on

Strojové učení je jednou z nejrychleji rostoucích technologických oblastí, ale navzdory tomu, jak často se slova „strojové učení“ přehazují, může být obtížné přesně pochopit, co strojové učení je.

Strojové učení neodkazuje pouze na jednu věc, je to zastřešující termín, který lze aplikovat na mnoho různých konceptů a technik. Porozumět strojovému učení znamená znát různé formy modelové analýzy, proměnných a algoritmů. Pojďme se blíže podívat na strojové učení, abychom lépe porozuměli tomu, co zahrnuje.

Co je strojové učení?

Zatímco termín strojové učení lze použít na mnoho různých věcí, obecně se tento termín vztahuje k tomu, že umožňuje počítači provádět úkoly, aniž by k tomu dostával výslovné instrukce řádek po řádku. Specialista na strojové učení nemusí vypisovat všechny kroky potřebné k vyřešení problému, protože počítač je schopen „učit se“ analýzou vzorců v datech a zobecněním těchto vzorců na nová data.

Systémy strojového učení mají tři základní části:

  • Vstupy
  • Algoritmy
  • Výstupy

Vstupy jsou data, která jsou přiváděna do systému strojového učení, a vstupní data lze rozdělit na štítky a prvky. Funkce jsou relevantní proměnné, proměnné, které budou analyzovány, abychom se naučili vzorce a vyvodili závěry. Mezitím jsou štítky třídy/popisy dané jednotlivým instancím dat.

Funkce a štítky lze použít ve dvou různých typech problémů strojového učení: učení pod dohledem a učení bez dozoru.

Učení bez dozoru vs. učení pod dohledem

In učení pod dohledem, jsou vstupní data doprovázena základní pravdou. Problémy s kontrolovaným učením mají správné výstupní hodnoty jako součást datové sady, takže očekávané třídy jsou známy předem. To umožňuje datovému vědci kontrolovat výkon algoritmu testováním dat na testovacím souboru dat a sledováním, jaké procento položek bylo správně klasifikováno.

V porovnání, učení bez dozoru problémy nemají nálepky základní pravdy. Algoritmus strojového učení trénovaný k provádění úkolů učení bez dozoru musí být schopen sám pro sebe odvodit příslušné vzorce v datech.

Algoritmy řízeného učení se obvykle používají pro klasifikační problémy, kde je k dispozici velký soubor dat naplněný instancemi, které je třeba třídit do jedné z mnoha různých tříd. Dalším typem řízeného učení je regresní úloha, kde je výstup hodnoty algoritmem kontinuální, nikoli kategorický.

Mezitím se algoritmy učení bez dozoru používají pro úkoly, jako je odhad hustoty, shlukování a učení reprezentace. Tyto tři úlohy potřebují model strojového učení k odvození struktury dat, modelu nejsou dány žádné předdefinované třídy.

Podívejme se stručně na některé z nejběžnějších algoritmů používaných jak při učení bez dozoru, tak při učení pod dohledem.

Typy řízeného učení

Mezi běžné algoritmy učení pod dohledem patří:

  • Naivní Bayes
  • Podporujte vektorové stroje
  • Logistická regrese
  • Náhodné lesy
  • Umělé neuronové sítě

Podporujte vektorové stroje jsou algoritmy, které rozdělují datovou sadu do různých tříd. Datové body jsou seskupeny do shluků nakreslením čar, které oddělují třídy od sebe. Body nalezené na jedné straně čáry budou patřit do jedné třídy, zatímco body na druhé straně čáry jsou jiné třídy. Cílem podpůrných vektorových strojů je maximalizovat vzdálenost mezi úsečkou a body nalezenými na obou stranách čáry, a čím větší je vzdálenost, tím jistější je klasifikátor, že bod patří do jedné třídy a ne do jiné třídy.

Logistická regrese je algoritmus používaný v úlohách binární klasifikace, kdy je třeba datové body klasifikovat jako patřící do jedné ze dvou tříd. Logistická regrese funguje tak, že datový bod označíte buď 1, nebo 0. Pokud je vnímaná hodnota datového bodu 0.49 nebo nižší, je klasifikován jako 0, zatímco pokud je 0.5 nebo vyšší, je klasifikován jako 1.

Algoritmy rozhodovacího stromu fungují tak, že rozdělují datové sady na menší a menší fragmenty. Přesná kritéria použitá k rozdělení dat závisí na inženýrovi strojového učení, ale cílem je nakonec rozdělit data do jednotlivých datových bodů, které pak budou klasifikovány pomocí klíče.

Algoritmus Random Forest je v podstatě mnoho jednotlivých klasifikátorů rozhodovacího stromu propojených do výkonnějšího klasifikátoru.

Projekt Naivní Bayesův klasifikátor vypočítá pravděpodobnost, že k danému datovému bodu došlo na základě pravděpodobnosti výskytu předchozí události. Je založen na Bayesově větě a umisťuje datové body do tříd na základě jejich vypočítané pravděpodobnosti. Při implementaci klasifikátoru Naive Bayes se předpokládá, že všechny prediktory mají stejný vliv na výsledek třídy.

An Umělá neuronová síť, nebo vícevrstvý perceptron, jsou algoritmy strojového učení inspirované strukturou a funkcí lidského mozku. Umělé neuronové sítě dostaly svůj název podle skutečnosti, že jsou vyrobeny z mnoha uzlů/neuronů spojených dohromady. Každý neuron manipuluje s daty pomocí matematické funkce. V umělých neuronových sítích existují vstupní vrstvy, skryté vrstvy a výstupní vrstvy.

Skrytá vrstva neuronové sítě je místem, kde jsou data skutečně interpretována a analyzována na vzory. Jinými slovy, je to místo, kde se algoritmus učí. Více neuronů spojených dohromady vytváří složitější sítě schopné učit se složitější vzorce.

Typy učení bez dozoru

Algoritmy učení bez dozoru zahrnují:

  • K znamená shlukování
  • Autokodéry
  • Analýza hlavních komponent

K znamená shlukování je technika klasifikace bez dozoru a funguje tak, že odděluje body dat do shluků nebo skupin na základě jejich vlastností. Shlukování K-means analyzuje vlastnosti nalezené v datových bodech a rozlišuje v nich vzory, díky kterým jsou datové body nalezené v daném shluku třídy navzájem více podobné, než jsou shlukům obsahujícím jiné datové body. Toho je dosaženo umístěním možných středů shluku nebo těžišť do grafu dat a přeřazením polohy těžiště, dokud není nalezena poloha, která minimalizuje vzdálenost mezi těžištěm a body, které patří do třídy tohoto těžiště. Výzkumník může specifikovat požadovaný počet shluků.

Analýza hlavních komponent je technika, která redukuje velký počet prvků/proměnných na menší prostor prvků/méně prvků. „Hlavní komponenty“ datových bodů jsou vybrány pro zachování, zatímco ostatní prvky jsou stlačeny do menší reprezentace. Vztah mezi původními datovými lektvary je zachován, ale protože složitost datových bodů je jednodušší, lze data snadněji kvantifikovat a popsat.

Autokodéry jsou verze neuronových sítí, které lze aplikovat na výukové úlohy bez dozoru. Autokodéry jsou schopny přijímat neoznačená data ve volném formátu a převádět je na data, která je schopna využít neuronová síť, v podstatě vytvářet svá vlastní označená trénovací data. Cílem automatického kodéru je převést vstupní data a znovu je sestavit co nejpřesněji, takže je v pobídce sítě určit, které funkce jsou nejdůležitější, a extrahovat je.

Blogerka a programátorka se specializací v Strojové učení a Hluboké učení témata. Daniel doufá, že pomůže ostatním využívat sílu AI pro společenské dobro.