заглушки Inflection-2.5: Powerhouse LLM конкурує з GPT-4 і Gemini - Unite.AI
Зв'язатися з нами

Штучний загальний інтелект

Inflection-2.5: Powerhouse LLM конкурує з GPT-4 і Gemini

mm
оновлений on
Перегин-2.5 ПІ

Флексія AI викликає хвилі в області великі мовні моделі (LLM) з нещодавнім відкриттям Inflection-2.5, моделі, яка конкурує з провідними світовими LLM, включаючи GPT-4 OpenAI і Gemini Google.

Швидкий розвиток штучного інтелекту Inflection додатково підживлювався масивним Раунд фінансування 1.3 мільярд доларів, на чолі з такими гігантами галузі, як Microsoft, NVIDIA, і відомими інвесторами, включаючи Рейда Гоффмана, Білла Гейтса та Еріка Шмідта. Завдяки цій значній інвестиції загальний обсяг фінансування, залученого компанією, склав 1.525 мільярда доларів.

У співпраці з партнерами CoreWeave і NVIDIA Inflection AI створює найбільший у світі кластер штучного інтелекту, який складається з безпрецедентних 22,000 100 графічних процесорів NVIDIA HXNUMX Tensor Core. Ця колосальна обчислювальна потужність підтримуватиме навчання та розгортання нового покоління великомасштабних моделей штучного інтелекту, що дозволить Inflection AI розширити межі того, що можливо у сфері персонального штучного інтелекту.

Новаторська робота компанії вже принесла чудові результати: кластер Inflection AI, який наразі включає понад 3,500 графічних процесорів NVIDIA H100 Tensor Core, забезпечує найсучаснішу продуктивність у тесті MLPerf з відкритим кодом. У спільній заявці з CoreWeave і NVIDIA кластер виконав еталонне навчальне завдання для великих мовних моделей всього за 11 хвилин, зміцнивши свою позицію як найшвидшого кластера в цьому тесті.

Це досягнення стало результатом відкриття Inflection-1, внутрішньої великої мовної моделі (LLM) Inflection AI, яка була визнана найкращою моделлю у своєму обчислювальному класі. Перевершуючи таких гігантів галузі, як GPT-3.5, LLaMA, Chinchilla та PaLM-540B, у широкому діапазоні тестів, які зазвичай використовуються для порівняння LLM, Inflection-1 дозволяє користувачам взаємодіяти з Pi, особистим ШІ Inflection AI, простим і природним способом. , отримання швидкої, актуальної та корисної інформації та порад.

Прихильність Inflection AI щодо прозорості та відтворюваності очевидна у випуску технічної пам’ятки, в якій детально описується оцінка та продуктивність Inflection-1 на різних тестах. Записка показує, що Inflection-1 перевершує моделі в тому ж класі обчислень, визначені як моделі, навчені з використанням щонайбільше FLOP (операцій з плаваючою комою) PaLM-540B.

Успіх Inflection-1 і швидке масштабування обчислювальної інфраструктури компанії, завдяки значному раунду фінансування, підкреслюють непохитну відданість Inflection AI виконанню своєї місії зі створення персонального ШІ для кожного. Завдяки інтеграції Inflection-1 у Pi користувачі тепер можуть відчути силу персонального штучного інтелекту, скориставшись перевагами його чуйної особистості, корисності та стандартів безпеки.

Флексія-2.5

Флексія-2.5 тепер доступний для всіх користувачів Pi, персонального помічника зі штучним інтелектом від Inflection AI, на багатьох платформах, включаючи Інтернет (pi.ai), iOS, Android і нову програму для комп’ютера. Ця інтеграція знаменує собою важливу віху в місії Inflection AI зі створення персонального ШІ для кожного, поєднуючи необроблені можливості з їх характерною чуйною індивідуальністю та стандартами безпеки.

Стрибок у продуктивності. Попередня модель ШІ Inflection, Inflection-1, використовувала приблизно 4% навчальних FLOP (операцій з плаваючою комою) GPT-4 і демонструвала середню продуктивність приблизно на 72% порівняно з GPT-4 для різних IQ-орієнтованих завдання. Завдяки Inflection-2.5 штучний інтелект Inflection суттєво розширив інтелектуальні здібності Pi, зосередившись на кодуванні та математиці.

Продуктивність моделі на ключових галузевих тестах демонструє її майстерність, демонструючи понад 94% середньої продуктивності GPT-4 у різних завданнях, з особливим наголосом на перевагах у сферах STEM. Це видатне досягнення є свідченням прагнення Inflection AI просувати технологічні межі, зберігаючи при цьому непохитну увагу до досвіду користувача та безпеки.

Майстерність кодування та математики Inflection-2.5 блищить у кодуванні та математиці, демонструючи понад 10% покращення Inflection-1 на BIG-Bench-Hard, підмножині складних задач для великих мовних моделей. Два тести кодування, MBPP+ і HumanEval+, показують значні покращення порівняно з Inflection-1, зміцнюючи позицію Inflection-2.5 як сили, з якою слід рахуватися в області кодування.

У тесті MBPP+ Inflection-2.5 значно перевершує свого попередника, демонструючи рівень продуктивності, який можна порівняти з GPT-4, як повідомляє DeepSeek Coder. Подібним чином у тесті HumanEval+ Inflection-2.5 демонструє значний прогрес, перевершуючи продуктивність Inflection-1 і наближаючись до рівня GPT-4, як повідомляється в таблиці лідерів EvalPlus.

Домінування в галузі

Inflection-2.5 виділяється в галузевих тестах, демонструючи суттєві покращення порівняно з Inflection-1 у тесті MMLU та тесті GPQA Diamond, відомому своїм експертним рівнем складності. Продуктивність моделі за цими контрольними показниками підкреслює її здатність справлятися з широким спектром завдань, від проблем рівня середньої школи до завдань професійного рівня.

Відмінність в іспитах STEM. Досконалість моделі поширюється на іспити STEM, з видатними показниками на іспитах з угорської математики та GRE з фізики. На іспиті з угорської математики Inflection-2.5 демонструє свою математичну здатність, використовуючи надану підказку та форматування, що полегшує відтворення.

На Physics GRE, вступному іспиті з фізики, Inflection-2.5 досягає 85-го процентиля людей, які здають іспит у maj@8 (більшість голосів — 8), зміцнюючи свою позицію вагомого суперника у сфері розв’язування проблем з фізики. . Крім того, модель наближається до найвищого результату в maj@32, демонструючи свою здатність вирішувати складні фізичні проблеми з надзвичайною точністю.

Покращення взаємодії з користувачем. Inflection-2.5 не лише дотримується характерних для Pi стандартів безпеки, але й підвищує його статус універсального та безцінного персонального ШІ для різноманітних тем. Від обговорення поточних подій до пошуку місцевих рекомендацій, підготовки до іспитів, програмування та навіть випадкових розмов, Pi на базі Inflection-2.5 обіцяє збагачений досвід користувача.

Завдяки потужним можливостям Inflection-2.5 користувачі залучаються до Pi з ширшим колом тем, ніж будь-коли раніше. Здатність моделі справлятися зі складними завданнями в поєднанні з чуйною особистістю та можливостями веб-пошуку в реальному часі гарантує, що користувачі отримають високоякісну актуальну інформацію та вказівки.

Прийняття та залучення користувачів Вплив інтеграції Inflection-2.5 у Pi вже очевидний у настроях користувачів, залученості та показниках утримання. Inflection AI став свідком значного прискорення органічного зростання користувачів: один мільйон активних користувачів щодня та шість мільйонів активних користувачів щомісяця обмінюються понад чотирма мільярдами повідомлень з Pi.

У середньому розмова з Пі триває 33 хвилини, причому кожен десятий триває більше години щодня. Крім того, приблизно 60% людей, які взаємодіють з Pi протягом певного тижня, повертаються наступного тижня, демонструючи вищу постійність щомісяця, ніж провідні конкуренти в цій галузі.

Технічні деталі та прозорість тестів

Відповідно до зобов’язань Inflection AI щодо прозорості та відтворюваності, компанія надала вичерпні технічні результати та детальну інформацію про продуктивність Inflection-2.5 у різних галузевих тестах.

Наприклад, у виправленій версії набору даних MT-Bench, яка вирішує проблеми з неправильними еталонними рішеннями та недоліками початкового набору даних, Inflection-2.5 демонструє продуктивність відповідно до очікувань на основі інших тестів.

Інфлекційний інтелект Inflection також оцінив Inflection-2.5 на HellaSwag і ARC-C, здоровому глузді та наукових тестах, зазначених у багатьох моделях, і результати демонструють високу ефективність цих насичених тестів.

Важливо зауважити, що хоча надані оцінки представляють модель, що працює над Pi, досвід користувача може дещо відрізнятися через такі фактори, як вплив веб-пошуку (не використовується в контрольних тестах), структура підказок кількох дій та інші відмінності на стороні виробництва.

Висновок

Inflection-2.5 являє собою значний крок вперед у галузі великих мовних моделей, конкуруючи з можливостями таких лідерів галузі, як GPT-4 і Gemini, використовуючи лише частину обчислювальних ресурсів. З його вражаючою продуктивністю в широкому діапазоні тестів, зокрема в областях STEM, кодуванні та математиці, Inflection-2.5 позиціонує себе як грізного суперника в ландшафті ШІ.

Інтеграція Inflection-2.5 у Pi, персонального помічника зі штучним інтелектом Inflection AI, обіцяє збагачену взаємодію з користувачем, поєднуючи необроблені можливості з чуйною особистістю та стандартами безпеки. Оскільки Inflection AI продовжує розширювати межі того, що можливо за допомогою LLM, спільнота AI з нетерпінням чекає наступної хвилі інновацій і проривів від цієї новаторської компанії.

Дальновидний підхід Inflection AI виходить за рамки простої розробки моделі, оскільки компанія визнає важливість попереднього навчання та тонкого налаштування для створення високоякісного, безпечного та корисного досвіду ШІ. Будучи вертикально інтегрованою студією штучного інтелекту, Inflection AI самостійно керує всім процесом, від прийому даних і проектування моделі до високопродуктивної інфраструктури.

Останні п’ять років я провів, занурюючись у захоплюючий світ машинного та глибокого навчання. Моя пристрасть і досвід допомогли мені внести свій внесок у понад 50 різноманітних проектів розробки програмного забезпечення, зосередивши особливу увагу на ШІ/ML. Моя постійна цікавість також привела мене до обробки природної мови, галузі, яку я хочу досліджувати далі.