talón Inflexión-2.5: El potente LLM que rivaliza con GPT-4 y Gemini - Unite.AI
Contáctanos

Inteligencia Artificial General

Inflexión-2.5: El poderoso LLM que rivaliza con GPT-4 y Gemini

mm
Actualizado on
Inflexión-2.5 PI

IA de inflexión ha estado causando sensación en el campo de grandes modelos de lenguaje (LLM) con su reciente presentación de Inflection-2.5, un modelo que compite con los LLM líderes del mundo, incluidos GPT-4 de OpenAI y Gemini de Google.

El rápido ascenso de la IA de inflexión se ha visto impulsado aún más por una enorme Ronda de financiación de $ 1.3 mil millones, liderado por gigantes de la industria como Microsoft, NVIDIA e inversores de renombre como Reid Hoffman, Bill Gates y Eric Schmidt. Esta importante inversión eleva la financiación total recaudada por la empresa a 1.525 millones de dólares.

En colaboración con los socios CoreWeave y NVIDIA, Inflection AI está construyendo el clúster de IA más grande del mundo, que comprende una cifra sin precedentes de 22,000 GPU NVIDIA H100 Tensor Core. Esta colosal potencia informática respaldará el entrenamiento y la implementación de una nueva generación de modelos de IA a gran escala, lo que permitirá a Inflection AI superar los límites de lo que es posible en el campo de la IA personal.

El trabajo innovador de la compañía ya ha arrojado resultados notables, con el clúster Inflection AI, que actualmente comprende más de 3,500 GPU NVIDIA H100 Tensor Core, que ofrece un rendimiento de última generación en el punto de referencia de código abierto MLPerf. En una presentación conjunta con CoreWeave y NVIDIA, el clúster completó la tarea de capacitación de referencia para modelos de lenguaje grandes en solo 11 minutos, consolidando su posición como el clúster más rápido en este punto de referencia.

Este logro sigue a la presentación de Inflection-1, el modelo de lenguaje grande (LLM) interno de Inflection AI, que ha sido aclamado como el mejor modelo en su clase de computación. Superando a gigantes de la industria como GPT-3.5, LLaMA, Chinchilla y PaLM-540B en una amplia gama de puntos de referencia comúnmente utilizados para comparar LLM, Inflection-1 permite a los usuarios interactuar con Pi, la IA personal de Inflection AI, de una manera simple y natural. , recibiendo información y consejos rápidos, relevantes y útiles.

El compromiso de Inflection AI con la transparencia y la reproducibilidad es evidente en la publicación de una nota técnica que detalla la evaluación y el rendimiento de Inflection-1 en varios puntos de referencia. El memorando revela que Inflection-1 supera a los modelos de la misma clase de computación, definidos como modelos entrenados utilizando como máximo las FLOP (operaciones de punto flotante) de PaLM-540B.

El éxito de Inflection-1 y el rápido escalamiento de la infraestructura informática de la compañía, impulsado por la importante ronda de financiación, resaltan la dedicación inquebrantable de Inflection AI para cumplir su misión de crear una IA personal para todos. Con la integración de Inflection-1 en Pi, los usuarios ahora pueden experimentar el poder de una IA personal, beneficiándose de su personalidad empática, utilidad y estándares de seguridad.

Inflexión-2.5

Inflexión-2.5 ahora está disponible para todos los usuarios de Pi, el asistente personal de IA de Inflection AI, en múltiples plataformas, incluida la web (pi.ai), iOS, Android y una nueva aplicación de escritorio. Esta integración marca un hito importante en la misión de Inflection AI de crear una IA personal para todos, combinando capacidad bruta con su personalidad empática y estándares de seguridad característicos.

Un salto en el rendimiento El modelo anterior de Inflection AI, Inflection-1, utilizó aproximadamente el 4% de las FLOP (operaciones de punto flotante) de entrenamiento de GPT-4 y exhibió un rendimiento promedio de alrededor del 72% en comparación con GPT-4 en varios sistemas orientados al coeficiente intelectual. tareas. Con Inflection-2.5, Inflection AI ha logrado un impulso sustancial en las capacidades intelectuales de Pi, con un enfoque en la codificación y las matemáticas.

El rendimiento del modelo en puntos de referencia clave de la industria demuestra su destreza, mostrando más del 94% del rendimiento promedio de GPT-4 en diversas tareas, con especial énfasis en sobresalir en áreas STEM. Este notable logro es un testimonio del compromiso de Inflection AI de impulsar la frontera tecnológica mientras mantiene un enfoque inquebrantable en la experiencia y la seguridad del usuario.

Destreza en codificación y matemáticas Inflexión-2.5 brilla en codificación y matemáticas, demostrando una mejora de más del 10% en Inflexión-1 en BIG-Bench-Hard, un subconjunto de problemas desafiantes para modelos de lenguaje grandes. Dos puntos de referencia de codificación, MBPP+ y HumanEval+, revelan mejoras masivas con respecto a Inflection-1, solidificando la posición de Inflection-2.5 como una fuerza a tener en cuenta en el dominio de la codificación.

En el punto de referencia MBPP+, Inflection-2.5 supera a su predecesor por un margen significativo, mostrando un nivel de rendimiento comparable al de GPT-4, según informó DeepSeek Coder. De manera similar, en el punto de referencia HumanEval+, Inflection-2.5 demuestra un progreso notable, superando el rendimiento de Inflection-1 y acercándose al nivel de GPT-4, como se informa en la tabla de clasificación de EvalPlus.

Dominio del punto de referencia de la industria

Inflection-2.5 se destaca en los puntos de referencia de la industria, mostrando mejoras sustanciales con respecto a Inflection-1 en el punto de referencia MMLU y el punto de referencia GPQA Diamond, reconocido por su dificultad de nivel experto. El desempeño del modelo en estos puntos de referencia subraya su capacidad para manejar una amplia gama de tareas, desde problemas de nivel de escuela secundaria hasta desafíos de nivel profesional.

Sobresaliendo en exámenes STEM La destreza del modelo se extiende a los exámenes STEM, con un desempeño destacado en el examen de Matemáticas de Hungría y el GRE de Física. En el examen de matemáticas de Hungría, Inflection-2.5 demuestra su aptitud matemática aprovechando el formato y el mensaje de pocas tomas proporcionados, lo que permite una fácil reproducibilidad.

En Física GRE, un examen de ingreso para graduados en física, Inflection-2.5 alcanza el percentil 85 de los examinados humanos en maj@8 (voto mayoritario de 8), consolidando su posición como un competidor formidable en el ámbito de la resolución de problemas de física. . Además, el modelo se acerca a la puntuación máxima en maj@32, demostrando su capacidad para abordar problemas físicos complejos con una precisión notable.

Mejora de la experiencia del usuario Inflection-2.5 no solo mantiene los estándares de seguridad y personalidad característicos de Pi, sino que eleva su estatus como una IA personal versátil e invaluable en diversos temas. Desde discutir eventos actuales hasta buscar recomendaciones locales, estudiar para exámenes, codificar e incluso conversaciones informales, Pi con tecnología Inflection-2.5 promete una experiencia de usuario enriquecida.

Con las poderosas capacidades de Inflection-2.5, los usuarios interactúan con Pi en una gama de temas más amplia que nunca. La capacidad del modelo para manejar tareas complejas, combinada con su personalidad empática y sus capacidades de búsqueda web en tiempo real, garantiza que los usuarios reciban información y orientación actualizadas y de alta calidad.

Adopción y participación del usuario El impacto de la integración de Inflection-2.5 en Pi ya es evidente en las métricas de sentimiento, participación y retención del usuario. Inflection AI ha sido testigo de una aceleración significativa en el crecimiento orgánico de usuarios, con un millón de usuarios activos diarios y seis millones mensuales intercambiando más de cuatro mil millones de mensajes con Pi.

En promedio, las conversaciones con Pi duran 33 minutos, y una de cada diez dura más de una hora cada día. Además, aproximadamente el 60% de las personas que interactúan con Pi en una semana determinada regresan la semana siguiente, lo que muestra una mayor adherencia mensual que los principales competidores en el campo.

Detalles técnicos y transparencia de referencia

En línea con el compromiso de Inflection AI con la transparencia y la reproducibilidad, la compañía ha proporcionado resultados técnicos completos y detalles sobre el rendimiento de Inflection-2.5 en varios puntos de referencia de la industria.

Por ejemplo, en la versión corregida del conjunto de datos MT-Bench, que aborda problemas con soluciones de referencia incorrectas y premisas defectuosas en el conjunto de datos original, Inflection-2.5 demuestra un rendimiento en línea con las expectativas basadas en otros puntos de referencia.

Inflection AI también ha evaluado Inflection-2.5 en HellaSwag y ARC-C, puntos de referencia científicos y de sentido común informados por una amplia gama de modelos, y los resultados muestran un sólido rendimiento en estos puntos de referencia saturados.

Es importante tener en cuenta que, si bien las evaluaciones proporcionadas representan el modelo que impulsa Pi, la experiencia del usuario puede variar ligeramente debido a factores como el impacto de la recuperación web (no utilizada en los puntos de referencia), la estructura de las indicaciones de pocos disparos y otros. diferencias en el lado de la producción.

Conclusión

Inflection-2.5 representa un importante avance en el campo de los modelos de lenguajes grandes, rivalizando con las capacidades de líderes de la industria como GPT-4 y Gemini mientras utiliza solo una fracción de los recursos informáticos. Con su impresionante rendimiento en una amplia gama de puntos de referencia, particularmente en áreas STEM, codificación y matemáticas, Inflection-2.5 se ha posicionado como un competidor formidable en el panorama de la IA.

La integración de Inflection-2.5 en Pi, el asistente personal de IA de Inflection AI, promete una experiencia de usuario enriquecida, combinando capacidad bruta con personalidad empática y estándares de seguridad. A medida que Inflection AI continúa superando los límites de lo que es posible con los LLM, la comunidad de IA anticipa con entusiasmo la próxima ola de innovaciones y avances de esta empresa pionera.

El enfoque visionario de Inflection AI se extiende más allá del mero desarrollo de modelos, ya que la empresa reconoce la importancia de la capacitación previa y el ajuste para crear experiencias de IA útiles, seguras y de alta calidad. Como estudio de IA integrado verticalmente, Inflection AI maneja todo el proceso internamente, desde la ingesta de datos y el diseño de modelos hasta la infraestructura de alto rendimiento.

He pasado los últimos cinco años sumergiéndome en el fascinante mundo del aprendizaje automático y el aprendizaje profundo. Mi pasión y experiencia me han llevado a contribuir en más de 50 proyectos diversos de ingeniería de software, con un enfoque particular en AI/ML. Mi curiosidad constante también me ha atraído hacia el procesamiento del lenguaje natural, un campo que estoy ansioso por explorar más a fondo.