заглушки Inflection-2.5: мощный LLM, конкурирующий с GPT-4 и Gemini - Unite.AI
Свяжитесь с нами:

Искусственный общий интеллект

Inflection-2.5: мощный LLM, конкурирующий с GPT-4 и Gemini

mm
обновленный on
Перегиб-2.5 ПИ

Перегиб ИИ произвел фурор в области большие языковые модели (LLM) с недавним представлением Inflection-2.5, модели, которая конкурирует с ведущими мировыми LLM, включая GPT-4 от OpenAI и Gemini от Google.

Быстрый рост Inflection AI подпитывается огромным Раунд финансирования в размере 1.3 миллиарда долларов, возглавляемая такими гигантами отрасли, как Microsoft, NVIDIA, и известными инвесторами, включая Рида Хоффмана, Билла Гейтса и Эрика Шмидта. Благодаря этим значительным инвестициям общий объем привлеченного компанией финансирования достиг 1.525 миллиарда долларов.

В сотрудничестве с партнерами CoreWeave и NVIDIA компания Inflection AI создает крупнейший в мире кластер искусственного интеллекта, включающий беспрецедентные 22,000 100 графических процессоров NVIDIA HXNUMX Tensor Core. Эта колоссальная вычислительная мощность будет способствовать обучению и развертыванию крупномасштабных моделей искусственного интеллекта нового поколения, позволяя Inflection AI раздвинуть границы возможного в области персонального искусственного интеллекта.

Инновационная работа компании уже дала замечательные результаты: кластер Inflection AI, в настоящее время состоящий из более чем 3,500 графических процессоров NVIDIA H100 с тензорными ядрами, обеспечивает высочайшую производительность в тесте MLPerf с открытым исходным кодом. По совместному сообщению CoreWeave и NVIDIA, кластер выполнил эталонную задачу обучения для больших языковых моделей всего за 11 минут, укрепив свою позицию самого быстрого кластера в этом тесте.

Это достижение последовало за представлением Inflection-1, собственной модели большого языка (LLM) Inflection AI, которая была признана лучшей моделью в своем вычислительном классе. Превосходя таких гигантов отрасли, как GPT-3.5, LLaMA, Chinchilla и PaLM-540B, по широкому спектру тестов, обычно используемых для сравнения LLM, Inflection-1 позволяет пользователям взаимодействовать с Pi, персональным искусственным интеллектом Inflection AI, простым и естественным способом. , получая быструю, актуальную и полезную информацию и советы.

Приверженность Inflection AI прозрачности и воспроизводимости очевидна в выпуске технической записки, подробно описывающей оценку и производительность Inflection-1 по различным критериям. В записке показано, что Inflection-1 превосходит модели в том же вычислительном классе, определяемом как модели, обученные с использованием максимум FLOP (операций с плавающей запятой) PaLM-540B.

Успех Inflection-1 и быстрое масштабирование вычислительной инфраструктуры компании, чему способствовал существенный раунд финансирования, подчеркивают непоколебимую приверженность Inflection AI выполнению своей миссии по созданию персонального ИИ для каждого. Благодаря интеграции Inflection-1 в Pi пользователи теперь могут ощутить мощь личного ИИ, извлекая выгоду из его чуткой индивидуальности, полезности и стандартов безопасности.

Перегиб-2.5

Перегиб-2.5 теперь доступен всем пользователям Pi, личного помощника по искусственному интеллекту Inflection AI, на нескольких платформах, включая Интернет (pi.ai), iOS, Android и новое настольное приложение. Эта интеграция знаменует собой важную веху в миссии Inflection AI по созданию персонального ИИ для каждого, сочетающего необузданные возможности с характерной чуткой индивидуальностью и стандартами безопасности.

Скачок в производительности Предыдущая модель Inflection AI, Inflection-1, использовала примерно 4% обучающих FLOP (операций с плавающей запятой) GPT-4 и демонстрировала среднюю производительность около 72% по сравнению с GPT-4 в различных IQ-ориентированных операциях. задания. С помощью Inflection-2.5 компания Inflection AI значительно увеличила интеллектуальные возможности Пи, уделив особое внимание программированию и математике.

Производительность модели по ключевым отраслевым показателям демонстрирует ее мастерство, демонстрируя более 94% средней производительности GPT-4 при выполнении различных задач, с особым упором на превосходство в областях STEM. Это выдающееся достижение является свидетельством стремления Inflection AI расширять технологические границы, сохраняя при этом неизменное внимание к пользовательскому опыту и безопасности.

Программирование и математика Inflection-2.5 блестяще справляется с программированием и математикой, демонстрируя улучшение более чем на 10% по сравнению с Inflection-1 на BIG-Bench-Hard, подмножестве сложных задач для больших языковых моделей. Два теста кодирования, MBPP+ и HumanEval+, демонстрируют значительные улучшения по сравнению с Inflection-1, укрепляя позицию Inflection-2.5 как силы, с которой нужно считаться в области кодирования.

По данным DeepSeek Coder, в тесте MBPP+ Inflection-2.5 значительно превосходит своего предшественника, демонстрируя уровень производительности, сравнимый с уровнем производительности GPT-4. Аналогичным образом, в тесте HumanEval+ Inflection-2.5 демонстрирует значительный прогресс, превосходя производительность Inflection-1 и приближаясь к уровню GPT-4, о чем сообщается в таблице лидеров EvalPlus.

Доминирование в отраслевых эталонах

Inflection-2.5 выделяется в отраслевых тестах, демонстрируя существенные улучшения по сравнению с Inflection-1 в тестах MMLU и тесте GPQA Diamond, известном своей сложностью экспертного уровня. Показатели модели по этим критериям подчеркивают ее способность решать широкий спектр задач: от задач школьного уровня до задач профессионального уровня.

Отличные результаты на экзаменах STEM Модель распространяется и на экзамены STEM: она демонстрирует выдающиеся результаты на экзамене по венгерской математике и GRE по физике. На экзамене по венгерской математике Inflection-2.5 демонстрирует свои математические способности, используя предоставленную подсказку и форматирование, обеспечивающие простоту воспроизводимости.

На GRE по физике, вступительном экзамене по физике, Inflection-2.5 достигает 85-го процентиля людей, сдающих тест в maj@8 (большинство голосов при 8), укрепляя свою позицию грозного соперника в области решения задач по физике. . Более того, модель приближается к наивысшему баллу в maj@32, демонстрируя свою способность решать сложные физические задачи с поразительной точностью.

Улучшение пользовательского опыта Inflection-2.5 не только поддерживает фирменные стандарты индивидуальности и безопасности Pi, но и повышает его статус универсального и бесценного персонального ИИ в различных областях. От обсуждения текущих событий до поиска местных рекомендаций, подготовки к экзаменам, программирования и даже случайных разговоров — Pi на базе Inflection-2.5 обещает расширенный пользовательский опыт.

Благодаря мощным возможностям Inflection-2.5 пользователи взаимодействуют с Pi по более широкому кругу тем, чем когда-либо прежде. Способность модели справляться со сложными задачами в сочетании с ее чуткой индивидуальностью и возможностями веб-поиска в режиме реального времени гарантирует, что пользователи получают высококачественную, актуальную информацию и рекомендации.

Принятие и вовлечение пользователей Влияние интеграции Inflection-2.5 в Pi уже очевидно по показателям настроений, вовлеченности и удержания пользователей. Inflection AI стал свидетелем значительного ускорения органического роста пользователей: один миллион активных пользователей в день и шесть миллионов в месяц обменивались с Pi более чем четырьмя миллиардами сообщений.

В среднем разговоры с Пи длятся 33 минуты, причем каждый десятый разговор длится более часа каждый день. Более того, примерно 60% людей, которые взаимодействовали с Пи на конкретной неделе, возвращаются на следующей неделе, демонстрируя более высокую ежемесячную приверженность, чем ведущие конкуренты в этой области.

Технические детали и прозрачность тестов

В соответствии с приверженностью Inflection AI прозрачности и воспроизводимости, компания предоставила исчерпывающие технические результаты и подробную информацию о производительности Inflection-2.5 в различных отраслевых тестах.

Например, в исправленной версии набора данных MT-Bench, которая устраняет проблемы с неверными эталонными решениями и ошибочными предпосылками в исходном наборе данных, Inflection-2.5 демонстрирует производительность, соответствующую ожиданиям, основанным на других тестах.

Inflection AI также оценил Inflection-2.5 на HellaSwag и ARC-C, тестах здравого смысла и научных данных, о которых сообщает широкий спектр моделей, и результаты демонстрируют высокие результаты в этих насыщенных тестах.

Важно отметить, что, хотя предоставленные оценки представляют собой модель, лежащую в основе Pi, пользовательский опыт может незначительно отличаться из-за таких факторов, как влияние веб-поиска (не используемого в тестах), структура подсказок с несколькими действиями и других производственные различия.

Заключение

Inflection-2.5 представляет собой значительный шаг вперед в области больших языковых моделей, конкурируя с возможностями лидеров отрасли, таких как GPT-4 и Gemini, при этом используя лишь часть вычислительных ресурсов. Благодаря своей впечатляющей производительности в широком спектре тестов, особенно в областях STEM, кодировании и математике, Inflection-2.5 позиционирует себя как серьезного соперника на рынке искусственного интеллекта.

Интеграция Inflection-2.5 в Pi, персонального искусственного помощника Inflection AI, обещает расширенный пользовательский опыт, сочетающий в себе необузданные возможности с чуткой индивидуальностью и стандартами безопасности. Поскольку Inflection AI продолжает расширять границы возможного с помощью LLM, сообщество ИИ с нетерпением ожидает следующей волны инноваций и прорывов от этой новаторской компании.

Дальновидный подход Inflection AI выходит за рамки простой разработки моделей, поскольку компания признает важность предварительного обучения и точной настройки для создания высококачественного, безопасного и полезного опыта работы с искусственным интеллектом. Являясь вертикально интегрированной студией искусственного интеллекта, Inflection AI самостоятельно выполняет весь процесс: от приема данных и проектирования моделей до высокопроизводительной инфраструктуры.

Последние пять лет я погружался в увлекательный мир машинного обучения и глубокого обучения. Моя страсть и опыт позволили мне принять участие в более чем 50 различных проектах по разработке программного обеспечения, уделяя особое внимание AI/ML. Мое постоянное любопытство также привлекло меня к обработке естественного языка, области, которую я очень хочу исследовать дальше.