-

Inteligencia artificial October 11, 2024SHOW-O: Un transformador único que une la comprensión y generación multimodal
Los avances significativos en los grandes modelos de lenguaje (LLM) han inspirado el desarrollo de modelos de lenguaje multimodal grandes (MLLM). Los esfuerzos iniciales de MLLM,...
-
Inteligencia artificial September 10, 2024EAGLE: Explorando el Espacio de Diseño para Modelos de Lenguaje Grande Multimodal con una Mezcla de Codificadores
La capacidad de interpretar con precisión la información visual compleja es un enfoque crucial de los modelos de lenguaje grande multimodal (MLLMs). Los trabajos recientes muestran...
-
Inteligencia artificial August 21, 2024LongWriter: Desbloqueando la generación de 10,000+ palabras desde LLMs de contexto largo
Los actuales modelos de lenguaje grande de contexto largo (LLMs) pueden procesar entradas de hasta 100,000 tokens, pero luchan por generar salidas que superen incluso una...
-
Inteligencia artificial July 15, 2024In-Paint3D: Generación de Imágenes utilizando Modelos de Difusión con Menos Iluminación
El advenimiento de los modelos de inteligencia artificial generativa profunda ha acelerado significativamente el desarrollo de la IA con capacidades notables en la generación de lenguaje...
-
Inteligencia artificial June 6, 2024LLaVA-UHD: un LMM que percibe cualquier relación de aspecto y imágenes de alta resolución
El progreso y avance recientes de los Grandes Modelos de Lenguaje han experimentado un aumento significativo en la razonamiento, comprensión y interacción visión-lenguaje. Los marcos modernos...


