talón ¿Qué es el aprendizaje automático? - Unite.AI
Contáctanos
Clase magistral de IA:

AI 101

¿Qué es el Aprendizaje Automático?

mm
Actualizado on

El aprendizaje automático es uno de los campos tecnológicos de más rápido crecimiento, pero a pesar de la frecuencia con la que se utiliza la palabra “aprendizaje automático”, puede resultar difícil entender qué es exactamente el aprendizaje automático.

Aprendizaje automático no se refiere a una sola cosa, es un término general que se puede aplicar a muchos conceptos y técnicas diferentes. Comprender el aprendizaje automático significa estar familiarizado con diferentes formas de análisis de modelos, variables y algoritmos. Echemos un vistazo de cerca al aprendizaje automático para comprender mejor lo que abarca.

¿Qué es el aprendizaje automático?

Si bien el término aprendizaje automático se puede aplicar a muchas cosas diferentes, en general, el término se refiere a permitir que una computadora realice tareas sin recibir instrucciones explícitas línea por línea para hacerlo. Un especialista en aprendizaje automático no tiene que escribir todos los pasos necesarios para resolver el problema porque la computadora es capaz de "aprender" analizando patrones dentro de los datos y generalizando estos patrones a nuevos datos.

Los sistemas de aprendizaje automático tienen tres partes básicas:

  • Ingresos
  • Algoritmos
  • Salidas

Las entradas son los datos que se introducen en el sistema de aprendizaje automático, y los datos de entrada se pueden dividir en etiquetas y características. Las características son las variables relevantes, las variables que se analizarán para aprender patrones y sacar conclusiones. Mientras tanto, las etiquetas son clases/descripciones dadas a las instancias individuales de los datos.

Las funciones y etiquetas se pueden utilizar en dos tipos diferentes de problemas de aprendizaje automático: aprendizaje supervisado y aprendizaje no supervisado.

Aprendizaje no supervisado vs. aprendizaje supervisado

In aprendizaje supervisado, los datos de entrada van acompañados de una verdad fundamental. Los problemas de aprendizaje supervisado tienen los valores de salida correctos como parte del conjunto de datos, por lo que las clases esperadas se conocen de antemano. Esto hace posible que el científico de datos verifique el rendimiento del algoritmo probando los datos en un conjunto de datos de prueba y viendo qué porcentaje de elementos se clasificaron correctamente.

A diferencia de, aprendizaje sin supervisión los problemas no tienen etiquetas de verdad fundamental adheridas a ellos. Un algoritmo de aprendizaje automático entrenado para llevar a cabo tareas de aprendizaje no supervisadas debe ser capaz de inferir los patrones relevantes en los datos por sí mismo.

Los algoritmos de aprendizaje supervisado generalmente se usan para problemas de clasificación, donde uno tiene un gran conjunto de datos lleno de instancias que deben clasificarse en una de muchas clases diferentes. Otro tipo de aprendizaje supervisado es una tarea de regresión, donde el valor generado por el algoritmo es de naturaleza continua en lugar de categórico.

Mientras tanto, los algoritmos de aprendizaje no supervisados ​​se utilizan para tareas como la estimación de densidad, la agrupación en clústeres y el aprendizaje de representación. Estas tres tareas necesitan el modelo de aprendizaje automático para inferir la estructura de los datos, no hay clases predefinidas dadas al modelo.

Echemos un breve vistazo a algunos de los algoritmos más comunes utilizados tanto en el aprendizaje no supervisado como en el aprendizaje supervisado.

Tipos de aprendizaje supervisado

Los algoritmos comunes de aprendizaje supervisado incluyen:

  • Bayes ingenuos
  • Máquinas de vectores de soporte
  • Regresión logística
  • Bosques al azar
  • Redes neuronales artificiales

Máquinas de vectores de soporte son algoritmos que dividen un conjunto de datos en diferentes clases. Los puntos de datos se agrupan en grupos dibujando líneas que separan las clases entre sí. Los puntos que se encuentran en un lado de la línea pertenecen a una clase, mientras que los puntos al otro lado de la línea pertenecen a una clase diferente. Las máquinas de vectores de soporte tienen como objetivo maximizar la distancia entre la línea y los puntos que se encuentran a cada lado de la línea, y cuanto mayor es la distancia, más seguro está el clasificador de que el punto pertenece a una clase y no a otra clase.

Regresión logística es un algoritmo utilizado en tareas de clasificación binaria cuando los puntos de datos deben clasificarse como pertenecientes a una de dos clases. La regresión logística funciona etiquetando el punto de datos como 1 o 0. Si el valor percibido del punto de datos es 0.49 o inferior, se clasifica como 0, mientras que si es 0.5 o superior se clasifica como 1.

Algoritmos de árbol de decisión funcionan dividiendo los conjuntos de datos en fragmentos cada vez más pequeños. El criterio exacto utilizado para dividir los datos depende del ingeniero de aprendizaje automático, pero el objetivo es, en última instancia, dividir los datos en puntos de datos únicos, que luego se clasificarán mediante una clave.

Un algoritmo de bosque aleatorio consiste esencialmente en muchos clasificadores de árbol de decisión únicos vinculados entre sí en un clasificador más potente.

El Clasificador ingenuo de Bayes Calcula la probabilidad de que haya ocurrido un punto de datos determinado en función de la probabilidad de que ocurra un evento anterior. Se basa en el teorema de Bayes y coloca los puntos de datos en clases según su probabilidad calculada. Al implementar un clasificador Naive Bayes, se supone que todos los predictores tienen la misma influencia en el resultado de la clase.

An Red neuronal artificial, o perceptrón multicapa, son algoritmos de aprendizaje automático inspirados en la estructura y función del cerebro humano. Las redes neuronales artificiales obtienen su nombre del hecho de que están formadas por muchos nodos/neuronas conectados entre sí. Cada neurona manipula los datos con una función matemática. En las redes neuronales artificiales, hay capas de entrada, capas ocultas y capas de salida.

La capa oculta de la red neuronal es donde los datos se interpretan y analizan en busca de patrones. En otras palabras, es donde el algoritmo aprende. Más neuronas unidas forman redes más complejas capaces de aprender patrones más complejos.

Tipos de aprendizaje no supervisado

Los algoritmos de aprendizaje no supervisado incluyen:

  • Agrupación de K-medias
  • Codificadores automáticos
  • Análisis de componentes principales

Agrupación de K-medias es una técnica de clasificación no supervisada y funciona separando puntos de datos en clústeres o grupos según sus características. El agrupamiento de K-medias analiza las características que se encuentran en los puntos de datos y distingue patrones en ellos que hacen que los puntos de datos que se encuentran en un grupo de clase dado sean más similares entre sí que con los grupos que contienen los otros puntos de datos. Esto se logra colocando posibles centros para el grupo, o centroides, en un gráfico de los datos y reasignando la posición del centroide hasta encontrar una posición que minimice la distancia entre el centroide y los puntos que pertenecen a la clase de ese centroide. El investigador puede especificar el número deseado de grupos.

Análisis de componentes principales es una técnica que reduce un gran número de características/variables a un espacio de características más pequeño/menos características. Los "componentes principales" de los puntos de datos se seleccionan para su conservación, mientras que las demás características se reducen a una representación más pequeña. La relación entre las pociones de datos originales se conserva, pero dado que la complejidad de los puntos de datos es más simple, los datos son más fáciles de cuantificar y describir.

Codificadores automáticos son versiones de redes neuronales que se pueden aplicar a tareas de aprendizaje no supervisadas. Los codificadores automáticos son capaces de tomar datos de forma libre y sin etiquetar y transformarlos en datos que una red neuronal es capaz de usar, básicamente creando sus propios datos de entrenamiento etiquetados. El objetivo de un codificador automático es convertir los datos de entrada y reconstruirlos con la mayor precisión posible, por lo que el incentivo de la red es determinar qué características son las más importantes y extraerlas.

Blogger y programador con especialidades en Aprendizaje automático (Machine learning & LLM) y Aprendizaje profundo temas Daniel espera ayudar a otros a usar el poder de la IA para el bien social.