taló Què és l'aprenentatge automàtic? - Unite.AI
Connecteu-vos amb nosaltres
Classe magistral d'IA:

IA 101

Què és l'aprenentatge automàtic?

mm
actualitzat on

L'aprenentatge automàtic és un dels camps tecnològics de creixement més ràpid, però malgrat la freqüència amb què es llancen les paraules "aprenentatge automàtic", pot ser difícil entendre què és l'aprenentatge automàtic, precisament.

L'aprenentatge automàtic no es refereix només a una cosa, és un terme paraigua que es pot aplicar a molts conceptes i tècniques diferents. Entendre l'aprenentatge automàtic significa familiaritzar-se amb diferents formes d'anàlisi de models, variables i algorismes. Fem una ullada de prop a l'aprenentatge automàtic per entendre millor què engloba.

Què és l'aprenentatge automàtic?

Tot i que el terme aprenentatge automàtic es pot aplicar a moltes coses diferents, en general, el terme es refereix a permetre que un ordinador dugui a terme tasques sense rebre instruccions explícites línia per línia per fer-ho. Un especialista en aprenentatge automàtic no ha d'escriure tots els passos necessaris per resoldre el problema perquè l'ordinador és capaç d'"aprendre" analitzant patrons dins de les dades i generalitzant aquests patrons a dades noves.

Els sistemes d'aprenentatge automàtic tenen tres parts bàsiques:

  • entrades
  • Algorismes
  • Sortides

Les entrades són les dades que s'introdueixen al sistema d'aprenentatge automàtic i les dades d'entrada es poden dividir en etiquetes i funcions. Les característiques són les variables rellevants, les variables que s'analitzaran per aprendre patrons i treure'n conclusions. Mentrestant, les etiquetes són classes/descripcions donades a les instàncies individuals de les dades.

Les característiques i les etiquetes es poden utilitzar en dos tipus diferents de problemes d'aprenentatge automàtic: aprenentatge supervisat i aprenentatge no supervisat.

Aprenentatge no supervisat vs

In aprenentatge supervisat, les dades d'entrada van acompanyades d'una veritat terrestre. Els problemes d'aprenentatge supervisat tenen els valors de sortida correctes com a part del conjunt de dades, de manera que les classes esperades es coneixen per endavant. Això fa possible que el científic de dades comprove el rendiment de l'algorisme provant les dades d'un conjunt de dades de prova i veient quin percentatge d'ítems es van classificar correctament.

En contrast, aprenentatge sense supervisió els problemes no tenen etiquetes de veritat del sòl adherides. Un algorisme d'aprenentatge automàtic entrenat per dur a terme tasques d'aprenentatge no supervisat ha de ser capaç d'inferir els patrons rellevants de les dades per si mateix.

Els algorismes d'aprenentatge supervisat s'utilitzen normalment per a problemes de classificació, on es disposa d'un gran conjunt de dades ple d'instàncies que s'han d'ordenar en una de moltes classes diferents. Un altre tipus d'aprenentatge supervisat és una tasca de regressió, on el valor de sortida de l'algorisme és de naturalesa contínua en lloc de categòrica.

Mentrestant, s'utilitzen algorismes d'aprenentatge no supervisat per a tasques com l'estimació de la densitat, l'agrupació i l'aprenentatge de la representació. Aquestes tres tasques necessiten el model d'aprenentatge automàtic per inferir l'estructura de les dades, no hi ha classes predefinides donades al model.

Fem una breu ullada a alguns dels algorismes més comuns utilitzats tant en l'aprenentatge no supervisat com en l'aprenentatge supervisat.

Tipus d'aprenentatge supervisat

Els algorismes comuns d'aprenentatge supervisat inclouen:

  • Bayes ingenu
  • Suport de màquines vectorials
  • Regressió logística
  • Boscos aleatoris
  • Xarxes de neurones artificials

Suport de màquines vectorials són algorismes que divideixen un conjunt de dades en diferents classes. Els punts de dades s'agrupen en grups dibuixant línies que separen les classes entre si. Els punts que es troben a un costat de la línia pertanyen a una classe, mentre que els punts a l'altre costat de la línia són d'una classe diferent. Les màquines de vectors de suport tenen com a objectiu maximitzar la distància entre la línia i els punts que es troben a banda i banda de la línia, i com més gran sigui la distància, més segur té el classificador que el punt pertany a una classe i no a una altra classe.

Regressió logística és un algorisme utilitzat en tasques de classificació binària quan els punts de dades s'han de classificar com a pertanyents a una de les dues classes. La regressió logística funciona etiquetant el punt de dades amb 1 o 0. Si el valor percebut del punt de dades és 0.49 o inferior, es classifica com a 0, mentre que si és 0.5 o superior es classifica com 1.

Algoritmes de l'arbre de decisió funcionen dividint conjunts de dades en fragments cada cop més petits. Els criteris exactes utilitzats per dividir les dades depèn de l'enginyer d'aprenentatge automàtic, però l'objectiu és, finalment, dividir les dades en punts de dades únics, que després es classificaran mitjançant una clau.

Un algorisme de bosc aleatori és essencialment molts classificadors d'arbre de decisions únics enllaçats en un classificador més potent.

El Classificador de Bayes ingenu calcula la probabilitat que s'hagi produït un punt de dades donat en funció de la probabilitat que es produeixi un esdeveniment anterior. Es basa en el teorema de Bayes i col·loca els punts de dades en classes en funció de la seva probabilitat calculada. Quan s'implementa un classificador Naive Bayes, se suposa que tots els predictors tenen la mateixa influència en el resultat de la classe.

An Xarxa neuronal artificial, o perceptron multicapa, són algorismes d'aprenentatge automàtic inspirats en l'estructura i la funció del cervell humà. Les xarxes neuronals artificials reben el seu nom pel fet que estan fetes de molts nodes/neurones connectats entre si. Cada neurona manipula les dades amb una funció matemàtica. A les xarxes neuronals artificials, hi ha capes d'entrada, capes ocultes i capes de sortida.

La capa oculta de la xarxa neuronal és on realment s'interpreten i s'analitzen les dades per trobar patrons. En altres paraules, és on l'algoritme aprèn. Més neurones unides fan xarxes més complexes capaços d'aprendre patrons més complexos.

Tipus d'aprenentatge no supervisat

Els algorismes d'aprenentatge no supervisat inclouen:

  • K-significa agrupació
  • Autocodificadors
  • Anàlisi de components principals

K-significa agrupació és una tècnica de classificació no supervisada i funciona separant punts de dades en clústers o grups en funció de les seves característiques. La agrupació K-means analitza les característiques que es troben als punts de dades i en distingeix patrons que fan que els punts de dades que es troben en un clúster de classes determinats siguin més semblants entre si del que són als clústers que contenen els altres punts de dades. Això s'aconsegueix col·locant els possibles centres per al clúster, o centroides, en un gràfic de les dades i reassignant la posició del centroide fins que es trobi una posició que minimitzi la distància entre el centroide i els punts que pertanyen a la classe d'aquest centroide. L'investigador pot especificar el nombre desitjat de clústers.

Anàlisi de components principals és una tècnica que redueix un gran nombre de característiques/variables a un espai de característiques més petit/menys característiques. Els "components principals" dels punts de dades es seleccionen per a la seva conservació, mentre que les altres característiques es redueixen en una representació més petita. Es conserva la relació entre les pocions de dades originals, però com que la complexitat dels punts de dades és més senzilla, les dades són més fàcils de quantificar i descriure.

Autocodificadors són versions de xarxes neuronals que es poden aplicar a tasques d'aprenentatge no supervisades. Els codificadors automàtics són capaços d'agafar dades de forma lliure sense etiquetar i transformar-les en dades que una xarxa neuronal és capaç d'utilitzar, bàsicament creant les seves pròpies dades d'entrenament etiquetades. L'objectiu d'un codificador automàtic és convertir les dades d'entrada i reconstruir-les amb la màxima precisió possible, de manera que està en l'incentiu de la xarxa determinar quines característiques són les més importants i extreure-les.

Blogger i programador amb especialitats en Aprenentatge automàtic i Aprenentatge profund temes. Daniel espera ajudar els altres a utilitzar el poder de la IA per al bé social.