Connect with us

O que é Aprendizado de Máquina?

IA 101

O que é Aprendizado de Máquina?

mm

O aprendizado de máquina é um dos campos tecnológicos de crescimento mais rápido, mas apesar de quanto as palavras “aprendizado de máquina” são frequentemente mencionadas, pode ser difícil entender o que é o aprendizado de máquina, precisamente.

Aprendizado de máquina não se refere a apenas uma coisa, é um termo guarda-chuva que pode ser aplicado a muitos conceitos e técnicas diferentes. Entender o aprendizado de máquina significa estar familiarizado com diferentes formas de análise de modelo, variáveis e algoritmos. Vamos dar uma olhada mais próxima no aprendizado de máquina para entender melhor o que ele abrange.

O que é Aprendizado de Máquina?

Enquanto o termo aprendizado de máquina pode ser aplicado a muitas coisas diferentes, em geral, o termo se refere a permitir que um computador execute tarefas sem receber instruções explícitas linha por linha para fazê-lo. Um especialista em aprendizado de máquina não precisa escrever todas as etapas necessárias para resolver o problema porque o computador é capaz de “aprender” analisando padrões dentro dos dados e generalizando esses padrões para novos dados.

Os sistemas de aprendizado de máquina têm três partes básicas:

  • Entradas
  • Algoritmos
  • Saídas

As entradas são os dados que são alimentados no sistema de aprendizado de máquina, e os dados de entrada podem ser divididos em rótulos e recursos. Recursos são as variáveis relevantes, as variáveis que serão analisadas para aprender padrões e tirar conclusões. Enquanto isso, os rótulos são classes/descrições dadas às instâncias individuais dos dados.

Recursos e rótulos podem ser usados em dois tipos diferentes de problemas de aprendizado de máquina: aprendizado supervisionado e aprendizado não supervisionado.

Aprendizado Não Supervisionado vs. Aprendizado Supervisionado

No aprendizado supervisionado, os dados de entrada são acompanhados por uma verdade fundamental. Os problemas de aprendizado supervisionado têm os valores de saída corretos como parte do conjunto de dados, então as classes esperadas são conhecidas antecipadamente. Isso torna possível para o cientista de dados verificar o desempenho do algoritmo testando os dados em um conjunto de teste e vendo que porcentagem de itens foi classificada corretamente.

Em contraste, aprendizado não supervisionado problemas não têm rótulos de verdade fundamental anexados a eles. Um algoritmo de aprendizado de máquina treinado para realizar tarefas de aprendizado não supervisionado deve ser capaz de inferir os padrões relevantes nos dados por si mesmo.

Algoritmos de aprendizado supervisionado são normalmente usados para problemas de classificação, onde se tem um grande conjunto de dados preenchido com instâncias que devem ser classificadas em uma das muitas classes diferentes. Outro tipo de aprendizado supervisionado é uma tarefa de regressão, onde o valor de saída do algoritmo é contínuo em natureza em vez de categórico.

Enquanto isso, algoritmos de aprendizado não supervisionado são usados para tarefas como estimativa de densidade, agrupamento e aprendizado de representação. Essas três tarefas precisam do modelo de aprendizado de máquina inferir a estrutura dos dados, não há classes pré-definidas dadas ao modelo.

Vamos dar uma olhada rápida em alguns dos algoritmos mais comuns usados em ambos os aprendizados supervisionado e não supervisionado.

Tipos de Aprendizado Supervisionado

Algoritmos de aprendizado supervisionado comuns incluem:

  • Naive Bayes
  • Máquinas de Vetor de Suporte
  • Regressão Logística
  • Florestas Aleatórias
  • Redes Neurais Artificiais

Máquinas de Vetor de Suporte são algoritmos que dividem um conjunto de dados em diferentes classes. Pontos de dados são agrupados em clusters desenhando linhas que separam as classes umas das outras. Pontos encontrados em um lado da linha pertencerão a uma classe, enquanto os pontos no outro lado da linha são uma classe diferente. Máquinas de Vetor de Suporte visam maximizar a distância entre a linha e os pontos encontrados em ambos os lados da linha, e quanto maior a distância, mais confiante é o classificador de que o ponto pertence a uma classe e não a outra classe.

Regressão Logística é um algoritmo usado em tarefas de classificação binária quando os pontos de dados precisam ser classificados como pertencentes a uma das duas classes. A Regressão Logística funciona rotulando o ponto de dados como 1 ou 0. Se o valor percebido do ponto de dados for 0,49 ou abaixo, ele é classificado como 0, enquanto se for 0,5 ou acima, é classificado como 1.

Algoritmos de Árvore de Decisão operam dividindo conjuntos de dados em fragmentos menores e menores. Os critérios exatos usados para dividir os dados são deixados ao engenheiro de aprendizado de máquina, mas o objetivo é dividir os dados em pontos de dados individuais, que serão então classificados usando uma chave.

Um algoritmo de Floresta Aleatória é essencialmente muitos classificadores de Árvore de Decisão individuais ligados juntos em um classificador mais poderoso.

O Classificador Naive Bayes calcula a probabilidade de que um dado ponto de dados tenha ocorrido com base na probabilidade de um evento anterior ocorrer. Ele é baseado no Teorema de Bayes e coloca os pontos de dados em classes com base em sua probabilidade calculada. Ao implementar um Classificador Naive Bayes, supõe-se que todos os preditores tenham a mesma influência no resultado da classe.

Uma Rede Neural Artificial, ou perceptron multicamada, são algoritmos de aprendizado de máquina inspirados na estrutura e função do cérebro humano. Redes Neurais Artificiais recebem seu nome do fato de serem feitas de muitos nodos/neurônios ligados juntos. Cada neurônio manipula os dados com uma função matemática. Em redes neurais artificiais, há camadas de entrada, camadas ocultas e camadas de saída.

A camada oculta da rede neural é onde os dados são realmente interpretados e analisados para padrões. Em outras palavras, é onde o algoritmo aprende. Mais neurônios juntos fazem redes mais complexas capazes de aprender padrões mais complexos.

Tipos de Aprendizado Não Supervisionado

Algoritmos de aprendizado não supervisionado incluem:

  • Agrupamento K-means
  • Autoencoders
  • Análise de Componentes Principais

Agrupamento K-means é uma técnica de classificação não supervisionada, e ele funciona separando pontos de dados em clusters ou grupos com base em seus recursos. O agrupamento K-means analisa os recursos encontrados nos pontos de dados e distingue padrões neles que fazem os pontos de dados encontrados em uma classe de cluster mais semelhantes entre si do que são para clusters que contêm os outros pontos de dados. Isso é realizado colocando possíveis centros para o cluster, ou centros, em um gráfico dos dados e reatribuindo a posição do centro até que uma posição seja encontrada que minimize a distância entre o centro e os pontos que pertencem à classe desse centro. O pesquisador pode especificar o número desejado de clusters.

Análise de Componentes Principais é uma técnica que reduz grandes números de recursos/variáveis para um espaço de recurso menor/número menor de recursos. Os “componentes principais” dos pontos de dados são selecionados para preservação, enquanto os outros recursos são comprimidos em uma representação menor. A relação entre as porções originais de dados é preservada, mas como a complexidade dos pontos de dados é mais simples, os dados são mais fáceis de quantificar e descrever.

Autoencoders são versões de redes neurais que podem ser aplicadas a tarefas de aprendizado não supervisionado. Autoencoders são capazes de pegar dados não rotulados, de forma livre, e transformá-los em dados que uma rede neural é capaz de usar, basicamente criando seus próprios dados de treinamento rotulados. O objetivo de um autoencoder é converter os dados de entrada e reconstruí-los com a máxima precisão possível, então está no interesse da rede determinar quais recursos são os mais importantes e extraí-los.

Blogueiro e programador com especialidades em Machine Learning e Deep Learning tópicos. Daniel espera ajudar os outros a usar o poder da IA para o bem social.