Inteligencia artificial

El auge de las unidades de procesamiento neural: Mejorando la inteligencia artificial generativa en dispositivos para velocidad y sostenibilidad

mm

La evolución de la inteligencia artificial generativa no solo está redefiniendo nuestra interacción y experiencias con los dispositivos de cómputo, sino que también está redefiniendo el núcleo de la computación. Uno de los principales impulsores de esta transformación es la necesidad de operar la inteligencia artificial generativa en dispositivos con recursos computacionales limitados. Este artículo discute los desafíos que esto presenta y cómo las unidades de procesamiento neural (NPUs) están emergiendo para solucionarlos. Además, el artículo presenta algunos de los procesadores NPU más recientes que están liderando el camino en este campo.

Desafíos de la infraestructura de inteligencia artificial generativa en dispositivos

La inteligencia artificial generativa, la potencia detrás de la síntesis de imágenes, la generación de texto y la composición de música, requiere recursos computacionales sustanciales. Convencionalmente, estas demandas se han satisfecho aprovechando las vastas capacidades de las plataformas en la nube. Si bien este enfoque es efectivo, conlleva su propio conjunto de desafíos para la inteligencia artificial generativa en dispositivos, incluyendo la dependencia de la conectividad a Internet constante y la infraestructura centralizada. Esta dependencia introduce latencia, vulnerabilidades de seguridad y un mayor consumo de energía.

El espinazo de la infraestructura de inteligencia artificial en la nube se basa en gran medida en las unidades centrales de procesamiento (CPUs) y las unidades de procesamiento gráfico (GPUs) para manejar las demandas computacionales de la inteligencia artificial generativa. Sin embargo, cuando se aplican a la inteligencia artificial generativa en dispositivos, estos procesadores encuentran obstáculos significativos. Las CPUs están diseñadas para tareas de propósito general y carecen de la arquitectura especializada necesaria para una ejecución eficiente y de baja potencia de las cargas de trabajo de la inteligencia artificial generativa. Sus capacidades de procesamiento paralelo limitadas resultan en un rendimiento reducido, una latencia aumentada y un mayor consumo de energía, lo que las hace menos ideales para la inteligencia artificial en dispositivos. Por otro lado, aunque las GPUs pueden destacar en el procesamiento paralelo, están diseñadas principalmente para tareas de procesamiento gráfico. Para realizar tareas de inteligencia artificial generativa de manera efectiva, las GPUs requieren circuitos integrados especializados, que consumen mucha energía y generan un calor significativo. Además, su gran tamaño físico crea obstáculos para su uso en aplicaciones compactas en dispositivos.

La emergencia de las unidades de procesamiento neural (NPUs)

En respuesta a los desafíos anteriores, las unidades de procesamiento neural (NPUs) están surgiendo como una tecnología transformadora para implementar la inteligencia artificial generativa en dispositivos. La arquitectura de las NPUs se inspira principalmente en la estructura y función del cerebro humano, particularmente en cómo las neuronas y las sinapsis colaboran para procesar la información. En las NPUs, las neuronas artificiales actúan como las unidades básicas, imitando a las neuronas biológicas al recibir entradas, procesarlas y producir salidas. Estas neuronas están interconectadas a través de sinapsis artificiales, que transmiten señales entre las neuronas con fuerzas variables que se ajustan durante el proceso de aprendizaje. Esto emula el proceso de cambios en el peso sináptico en el cerebro. Las NPUs se organizan en capas; capas de entrada que reciben datos sin procesar, capas ocultas que realizan un procesamiento intermedio y capas de salida que generan los resultados. Esta estructura en capas refleja la capacidad de procesamiento de información en varias etapas y paralela del cerebro. Como la inteligencia artificial generativa también se construye utilizando una estructura similar de redes neuronales artificiales, las NPUs están bien adaptadas para manejar las cargas de trabajo de la inteligencia artificial generativa. Esta alineación estructural reduce la necesidad de circuitos integrados especializados, lo que lleva a soluciones más compactas, eficientes en términos de energía, rápidas y sostenibles.

Abordar las diversas necesidades computacionales de la inteligencia artificial generativa

La inteligencia artificial generativa abarca una amplia gama de tareas, incluyendo la síntesis de imágenes, la generación de texto y la composición de música, cada una con su propio conjunto de requisitos computacionales únicos. Por ejemplo, la síntesis de imágenes depende en gran medida de las operaciones matriciales, mientras que la generación de texto implica un procesamiento secuencial. Para atender eficazmente a estas diversas necesidades computacionales, las unidades de procesamiento neural (NPUs) a menudo se integran en la tecnología System-on-Chip (SoC) junto con las CPUs y las GPUs.

Cada uno de estos procesadores ofrece fortalezas computacionales distintas. Las CPUs son particularmente aptas para el control secuencial y la inmediatez, las GPUs destacan en el procesamiento paralelo de datos y las NPUs están finamente ajustadas para las operaciones básicas de la inteligencia artificial, tratando con matemáticas escalares, vectoriales y tensoriales. Al aprovechar una arquitectura de computación heterogénea, las tareas se pueden asignar a los procesadores según sus fortalezas y las demandas de la tarea específica en cuestión.

Las NPUs, al estar optimizadas para las cargas de trabajo de la inteligencia artificial, pueden descargarse eficientemente las tareas de la inteligencia artificial generativa del CPU principal. Esta descarga no solo garantiza operaciones rápidas y eficientes en términos de energía, sino que también acelera las tareas de inferencia de la inteligencia artificial, permitiendo que los modelos de la inteligencia artificial generativa se ejecuten más suavemente en el dispositivo. Con las NPUs manejando las tareas relacionadas con la inteligencia artificial, las CPUs y las GPUs son libres de asignar recursos a otras funciones, mejorando así el rendimiento general de la aplicación mientras se mantiene la eficiencia térmica.

Ejemplos del mundo real de NPUs

El avance de las NPUs está ganando impulso. A continuación, se presentan algunos ejemplos del mundo real de NPUs:

  • Hexagon NPUs de Qualcomm está diseñado específicamente para acelerar las tareas de inferencia de la inteligencia artificial a baja potencia y en dispositivos con pocos recursos. Está construido para manejar tareas de la inteligencia artificial generativa como la generación de texto, la síntesis de imágenes y el procesamiento de audio. El Hexagon NPU se integra en las plataformas Snapdragon de Qualcomm, proporcionando una ejecución eficiente de los modelos de redes neuronales en dispositivos con productos de inteligencia artificial de Qualcomm.
  • Apple’s Neural Engine es un componente clave de los chips de la serie A y la serie M, que alimentan diversas características impulsadas por la inteligencia artificial como Face ID, Siri y realidad aumentada (AR). El Neural Engine acelera tareas como el reconocimiento facial para Face ID seguro, el procesamiento del lenguaje natural (NLP) para Siri y el seguimiento mejorado de objetos y la comprensión de escenas para aplicaciones de realidad aumentada. Mejora significativamente el rendimiento de las tareas relacionadas con la inteligencia artificial en los dispositivos de Apple, proporcionando una experiencia del usuario fluida y eficiente.
  • El NPU de Samsung es un procesador especializado diseñado para el cálculo de la inteligencia artificial, capaz de manejar miles de cálculos simultáneamente. Integrado en los SoCs Exynos más recientes de Samsung, que alimentan muchos teléfonos Samsung, esta tecnología NPU permite cálculos de la inteligencia artificial generativa de baja potencia y alta velocidad. La tecnología NPU de Samsung también se integra en televisores de alta gama, permitiendo la innovación del sonido impulsada por la inteligencia artificial y mejorando las experiencias del usuario.
  • La arquitectura Da Vinci de Huawei sirve como el núcleo de su procesador de inteligencia artificial Ascend, diseñado para mejorar la potencia de cálculo de la inteligencia artificial. La arquitectura aprovecha un potente motor de cálculo en cubo 3D, lo que la hace poderosa para las cargas de trabajo de la inteligencia artificial.

En resumen

La inteligencia artificial generativa está transformando nuestra interacción con los dispositivos y redefiniendo la computación. El desafío de ejecutar la inteligencia artificial generativa en dispositivos con recursos computacionales limitados es significativo, y las CPUs y las GPUs tradicionales a menudo no están a la altura. Las unidades de procesamiento neural (NPUs) ofrecen una solución prometedora con su arquitectura especializada diseñada para satisfacer las demandas de la inteligencia artificial generativa. Al integrar las NPUs en la tecnología System-on-Chip (SoC) junto con las CPUs y las GPUs, podemos aprovechar las fortalezas de cada procesador, lo que conduce a un rendimiento de la inteligencia artificial más rápido, eficiente y sostenible en los dispositivos. A medida que las NPUs siguen evolucionando, están destinadas a mejorar las capacidades de la inteligencia artificial en los dispositivos, haciendo que las aplicaciones sean más responsivas y eficientes en términos de energía.

El Dr. Tehseen Zia es un profesor asociado titular en la Universidad COMSATS de Islamabad, con un doctorado en Inteligencia Artificial de la Universidad Técnica de Viena, Austria. Especializado en Inteligencia Artificial, Aprendizaje Automático, Ciencia de Datos y Visión por Computadora, ha hecho contribuciones significativas con publicaciones en revistas científicas reputadas. El Dr. Tehseen también ha liderado varios proyectos industriales como investigador principal y ha servido como consultor de Inteligencia Artificial.