Штучний інтелект
Microsoft представила Phi-3: Потужні відкриті моделі штучного інтелекту, які забезпечують найвищу продуктивність при малих розмірах

Microsoft представила Phi-3, нову сім’ю малих мовних моделей (SLM), які спрямовані на забезпечення високої продуктивності та ефективності витрат у застосуваннях штучного інтелекту. Ці моделі показали сильні результати по різних стандартах у мовній компренсії, розумінні, кодуванні та математиці при порівнянні з моделями подібних та більших розмірів. Випуск Phi-3 розширює варіанти, доступні розробникам та підприємствам, які бажають використовувати штучний інтелект, збалансувавши ефективність та витрати.
Сім’я моделей Phi-3 та доступність
Першою моделлю у лінійці Phi-3 є Phi-3-mini, модель з 3,8 млрд параметрів, яка зараз доступна на Azure AI Studio, Hugging Face та Ollama. Phi-3-mini поставляється з інструкціями, що дозволяє використовувати її “з коробки” без тривалих налаштувань. Вона має вікно контексту до 128К токенів, найдовше у своєму класі, що дозволяє обробляти більші текстові вхідні дані без втрати продуктивності.
Для оптимізації продуктивності на різних апаратних конфігураціях Phi-3-mini була доналаштована для ONNX Runtime та NVIDIA GPU. Microsoft планує розширити сім’ю Phi-3 у найближчому майбутньому випуском Phi-3-small (7 млрд параметрів) та Phi-3-medium (14 млрд параметрів). Ці додаткові моделі забезпечать ширший спектр варіантів для задоволення різних потреб та бюджетів.

Зображення: Microsoft
Продуктивність та розвиток Phi-3
Microsoft повідомляє, що моделі Phi-3 показали суттєве покращення продуктивності порівняно з моделями такого ж розміру та навіть більших моделями по різних стандартах. За даними компанії, Phi-3-mini перевершує моделі вдвічі більших розмірів у завданнях мовного розуміння та генерації, тоді як Phi-3-small та Phi-3-medium перевершують значно більші моделі, такі як GPT-3.5T, у певних оцінках.
Microsoft зазначає, що розвиток моделей Phi-3 здійснювався згідно з принципами та стандартами Responsible AI компанії, які підкреслюють відповідальність, прозорість, справедливість, надійність, безпеку, конфіденційність, безпеку та інклюзивність. Моделі, як повідомляється, пройшли навчання з безпеки, оцінки та червоних команд для забезпечення дотримання відповідальних практик розгортання штучного інтелекту.

Зображення: Microsoft
Потенційні застосування та можливості Phi-3
Сім’я Phi-3 розроблена для успіху у сценаріях, де ресурси обмежені, низька затримка є суттєвою, або ефективність витрат є пріоритетом. Ці моделі мають потенціал забезпечити висновок на пристрої, дозволяючи застосункам штучного інтелекту працювати ефективно на широкому спектрі пристроїв, включаючи ті, що мають обмежену обчислювальну потужність. Менший розмір моделей Phi-3 також може зробити доналаштування та налаштування більш доступними для підприємств, дозволяючи їм адаптувати моделі до своїх конкретних випадків використання без високих витрат.
У застосуваннях, де швидкі часи відповіді є критичними, моделі Phi-3 пропонують перспективне рішення. Їх оптимізована архітектура та ефективна обробка можуть забезпечити швидке покоління результатів, покращуючи досвід користувача та відкриваючи можливості для взаємодії з штучним інтелектом у реальному часі. Крім того, сильні можливості розуміння та логіки Phi-3-mini роблять її добре підходящою для аналітичних завдань, таких як аналіз даних та генерація інсайтів.
