Connect with us

Co je strojové učení?

AI 101

Co je strojové učení?

mm

Strojové učení je jedním z nejrychleji rostoucích technologických oborů, ale navzdory tomu, jak často se slova „strojové učení“ používají, může být obtížné pochopit, co strojové učení přesně je.

Strojové učení se nevztahuje pouze na jednu věc, je to pojem, který lze aplikovat na mnoho různých konceptů a technik. Pochopení strojového učení znamená být seznámen s různými formami analýzy modelů, proměnných a algoritmů. Podívejme se blíže na strojové učení, abychom lépe pochopili, co zahrnuje.

Co je strojové učení?

Zatímco pojem strojové učení lze aplikovat na mnoho různých věcí, obecně se termín vztahuje na umožnění počítači vykonávat úkoly bez přijímání explicitních pokynů řádek po řádku. Specialista na strojové učení nemusí psát všechny kroky nezbytné pro řešení problému, protože počítač je schopen „učit se“ analýzou vzorců v datech a zobecněním těchto vzorců na nová data.

Systémy strojového učení mají tři základní části:

  • Vstupy
  • Algoritmy
  • Výstupy

Vstupy jsou data, která jsou zavedena do systému strojového učení, a vstupní data lze rozdělit na popisky a funkce. Funkce jsou relevantní proměnné, proměnné, které budou analyzovány pro naučení vzorců a vyvození závěrů. Zatímco popisky jsou třídy/popisy přiřazené k jednotlivým instancím dat.

Funkce a popisky lze použít ve dvou typech problémů strojového učení: dohledované učení a nedohledované učení.

Nedohledované vs. dohledované učení

U dohledovaného učení je vstupní data doprovázeno skutečnou hodnotou. Problémy dohledovaného učení mají správné výstupní hodnoty jako součást datové sady, takže očekávané třídy jsou známy předem. To umožňuje datovému vědci kontrolovat výkon algoritmu testováním dat na testovací datové sadě a zjišťováním, jaký procentní podíl položek byl správně klasifikován.

Naopak, nedohledované učení problémy nemají skutečnosti popisky připojené k nim. Algoritmus strojového učení proškolený pro vykonávání úkolů nedohledovaného učení musí být schopen odvodit relevantní vzorce v datech sám.

Algoritmy dohledovaného učení se obvykle používají pro klasifikační problémy, kde máte velkou datovou sadu plnou instancí, které musí být seřazeny do jedné z mnoha různých tříd. Další typ dohledovaného učení je regresní úkol, kde hodnota výstupu algoritmu je spojité povahy místo kategorické.

Zatímco algoritmy nedohledovaného učení se používají pro úkoly, jako je odhad hustoty, shlukování a učení reprezentace. Tyto tři úkoly vyžadují, aby model strojového učení odvodil strukturu dat, nejsou žádné předdefinované třídy přiřazené k modelu.

Podívejme se na některé z nejčastějších algoritmů používaných v obou dohledovaném učení a nedohledovaném učení.

Typy dohledovaného učení

Obecné algoritmy dohledovaného učení zahrnují:

  • Naivní Bayes
  • Podporovací vektorové stroje
  • Logistická regrese
  • Náhodné lesy
  • Umělé neuronové sítě

Podporovací vektorové stroje jsou algoritmy, které rozdělují datovou sadu do různých tříd. Datové body jsou seskupeny do clusterů kreslením linek, které oddělují třídy od sebe. Body nalezené na jedné straně linie budou patřit do jedné třídy, zatímco body na druhé straně linie jsou odlišné třídy. Podporovací vektorové stroje cílí maximalizovat vzdálenost mezi linií a body nalezenými na obou stranách linie, a čím větší je vzdálenost, tím více je klasifikátor přesvědčen, že bod patří do jedné třídy a ne do druhé třídy.

Logistická regrese je algoritmus používaný v binárních klasifikačních úkolech, kdy datové body potřebují být klasifikovány jako patřící do jedné ze dvou tříd. Logistická regrese funguje tak, že označuje datové body buď 1 nebo 0. Pokud je vnímaná hodnota datového bodu 0,49 nebo nižší, je klasifikován jako 0, zatímco pokud je 0,5 nebo vyšší, je klasifikován jako 1.

Algoritmy rozhodovacích stromů fungují tak, že rozdělují datové sady na menší a menší fragmenty. Přesné kritérium používané pro rozdělení dat je na rozhodnutí inženýra strojového učení, ale cílem je nakonec rozdělit data na jednotlivé datové body, které budou poté klasifikovány pomocí klíče.

Algoritmus náhodného lesa je vlastně mnoho samostatných klasifikátorů rozhodovacích stromů spojených dohromady do jednoho silnějšího klasifikátoru.

Klasifikátor Naivní Bayes vypočítává pravděpodobnost, že se daný datový bod udál na základě pravděpodobnosti předchozí události. Je založen na Bayesově teorému a umístí datové body do tříd na základě jejich vypočítané pravděpodobnosti. Při implementaci klasifikátoru Naivní Bayes se předpokládá, že všechny prediktory mají stejný vliv na výsledek třídy.

Umělé neuronové sítě nebo vícevrstvé perceptrony jsou algoritmy strojového učení inspirované strukturou a funkcí lidského mozku. Umělé neuronové sítě získávají své jméno z faktu, že se skládají z mnoha uzlů/neuronů spojených dohromady. Každý neuron manipuluje daty matematickou funkcí. V umělých neuronových sítích jsou vstupní vrstvy, skryté vrstvy a výstupní vrstvy.

Skrytá vrstva neuronové sítě je místem, kde se data skutečně interpretují a analyzují pro vzorce. Jinými slovy, je to místo, kde algoritmus učí. Více neuronů spojených dohromady vytváří složitější sítě schopné učit se složitějším vzorcům.

Typy nedohledovaného učení

Algoritmy nedohledovaného učení zahrnují:

  • Shlukování K-means
  • Autoenkodéry
  • Analýza hlavních komponent

Shlukování K-means je technika nedohledované klasifikace, a funguje tak, že rozděluje body dat do clusterů nebo skupin na základě jejich funkcí. Shlukování K-means analyzuje funkce nalezené v datech a rozlišuje vzorce v nich, které činí datové body nalezené v dané třídě clusteru více podobné sobě navzájem než datové body nalezené v clusteru obsahujícím ostatní datové body. To je dosaženo umístěním možných center clusteru, nebo centroidů, do grafu dat a opětovným přiřazením polohy centroidu, dokud není nalezena poloha, která minimalizuje vzdálenost mezi centroidem a body, které patří do třídy centroidu. Výzkumník může specifikovat požadovaný počet clusterů.

Analýza hlavních komponent je technika, která snižuje velký počet funkcí/proměnných na menší prostor funkcí/méně funkcí. „Hlavní komponenty“ datových bodů jsou vybrány pro uchování, zatímco ostatní funkce jsou stlačeny do menší reprezentace. Vztah mezi původními datovými body je zachován, ale protože komplexita datových bodů je jednodušší, data jsou snazší kvantifikovat a popsat.

Autoenkodéry jsou verze neuronových sítí, které lze aplikovat na úkoly nedohledovaného učení. Autoenkodéry jsou schopny převést neoznačená, volná data a transformovat je na data, která neuronová síť může použít,基本ně vytvářející svá vlastní označená trénovací data. Cílem autoenkodéru je převést vstupní data a znovu je postavit co nejpřesněji, takže je v zájmu sítě určit, které funkce jsou nejvýznamnější a extrahovat je.

Blogger a programátor se specializací na Machine Learning a Deep Learning témata. Daniel doufá, že pomůže ostatním využít sílu AI pro sociální dobro.