Изкуствен интелект
Microsoft разкрива Phi-3: Мощни отворени AI модели, осигуряващи най-добра производителност при малки размери
Microsoft представи Phi-3, ново семейство от малки езикови модели (SLM) които имат за цел да осигурят висока производителност и рентабилност в AI приложения. Тези модели са показали силни резултати при тестове за разбиране на езика, мислене, кодиране и математика в сравнение с модели с подобни и по-големи размери. Пускането на Phi-3 разширява опциите, достъпни за разработчиците и фирмите, които искат да използват AI, като същевременно балансират ефективността и разходите.
Семейство модели Phi-3 и наличност
Първият модел в гамата Phi-3 е Phi-3-mini, модел с параметри 3.8B, който вече се предлага на Azure AI Studio, Прегърнато лице, и Олама. Phi-3-mini идва с настроени инструкции, което му позволява да се използва „извън кутията“ без обширна фина настройка. Той разполага с контекстен прозорец от до 128K токени, най-дългият в своя клас, което позволява обработка на по-големи текстови входове без жертване на производителността.
За оптимизиране на производителността при хардуерни настройки, Phi-3-mini е фино настроен за ONNX Runtime и NVIDIA GPU. Microsoft планира да разшири фамилията Phi-3 скоро с пускането на Phi-3-small (7B параметри) и Phi-3-medium (14B параметри). Тези допълнителни модели ще предоставят по-широка гама от опции за посрещане на различни нужди и бюджети.
Производителност и развитие на Phi-3
Microsoft съобщава, че моделите Phi-3 са демонстрирали значителни подобрения в производителността в сравнение с модели със същия размер и дори по-големи модели в различни бенчмаркове. Според компанията Phi-3-mini е превъзхождал моделите два пъти по-големия си при задачи за разбиране на език и генериране, докато Phi-3-small и Phi-3-medium са надминавали много по-големи модели, като GPT-3.5T, в определени случаи оценки.
Microsoft заявява, че разработката на моделите Phi-3 е следвала тази на компанията Принципи на отговорния AI и стандарти, които наблягат на отчетност, прозрачност, справедливост, надеждност, безопасност, поверителност, сигурност и приобщаване. Съобщава се, че моделите са преминали обучение за безопасност, оценки и екипиране, за да се гарантира спазването на отговорни практики за внедряване на AI.
Потенциални приложения и възможности на Phi-3
Фамилията Phi-3 е проектирана да превъзхожда в сценарии, при които ресурсите са ограничени, ниското забавяне е от съществено значение или рентабилността е приоритет. Тези модели имат потенциала да позволят извод на устройството, позволявайки на приложенията, задвижвани от AI, да работят ефективно на широк набор от устройства, включително такива с ограничена изчислителна мощност. По-малкият размер на моделите Phi-3 може също така да направи фината настройка и персонализирането по-достъпни за бизнеса, което им позволява да адаптират моделите към техните специфични случаи на употреба, без да налагат високи разходи.
В приложения, където бързото време за реакция е критично, моделите Phi-3 предлагат обещаващо решение. Тяхната оптимизирана архитектура и ефективна обработка могат да позволят бързо генериране на резултати, подобряване на потребителското изживяване и отваряне на възможности за взаимодействия с AI в реално време. В допълнение, силните разсъждения и логически способности на Phi-3-mini го правят много подходящ за аналитични задачи, като анализ на данни и генериране на прозрения.