Artificial Intelligence
Microsoft przedstawia Phi-3: potężne modele otwartej sztucznej inteligencji zapewniające najwyższą wydajność przy małych rozmiarach
Microsoft wprowadził Phi-3, nową rodzinę małe modele językowe (SLM) których celem jest zapewnienie wysokiej wydajności i opłacalności w zastosowaniach AI. Modele te wykazały dobre wyniki w testach rozumienia języka, rozumowania, kodowania i matematyki w porównaniu z modelami o podobnych i większych rozmiarach. Wydanie Phi-3 rozszerza opcje dostępne dla programistów i firm, które chcą wykorzystać sztuczną inteligencję, jednocześnie równoważąc wydajność i koszty.
Rodzina modeli Phi-3 i ich dostępność
Pierwszym modelem w ofercie Phi-3 jest Phi-3-mini, model o parametrach 3.8B, teraz dostępny na Studio sztucznej inteligencji platformy Azure, Przytulanie Twarzy, Ollama. Phi-3-mini jest dostarczany zgodnie z instrukcjami, dzięki czemu można go używać „od razu po wyjęciu z pudełka” bez konieczności szczegółowego dostrajania. Posiada okno kontekstowe zawierające do 128 tys. tokenów, najdłuższe w swojej klasie wielkości, umożliwiające przetwarzanie większych danych wejściowych tekstowych bez utraty wydajności.
Aby zoptymalizować wydajność w różnych konfiguracjach sprzętowych, Phi-3-mini został dostrojony do procesorów graficznych ONNX Runtime i NVIDIA. Microsoft planuje wkrótce rozszerzyć rodzinę Phi-3 o wydanie Phi-3-small (parametry 7B) i Phi-3-medium (parametry 14B). Te dodatkowe modele zapewnią szerszy zakres opcji, aby sprostać różnorodnym potrzebom i budżetom.
Wydajność i rozwój Phi-3
Firma Microsoft informuje, że modele Phi-3 wykazały w różnych testach znaczną poprawę wydajności w porównaniu z modelami tej samej wielkości, a nawet większymi modelami. Według firmy modele Phi-3-mini dwukrotnie przewyższają modele w zakresie rozumienia języka i generowania zadań, podczas gdy Phi-3-small i Phi-3-medium przewyższają w niektórych przypadkach znacznie większe modele, takie jak GPT-3.5T. oceny.
Microsoft twierdzi, że rozwój modeli Phi-3 poszedł w ślady firmy Zasady odpowiedzialnej sztucznej inteligencji i standardy, które kładą nacisk na odpowiedzialność, przejrzystość, uczciwość, niezawodność, bezpieczeństwo, prywatność, ochronę i włączenie. Według doniesień modele przeszły szkolenia w zakresie bezpieczeństwa, oceny i współpracę red-team, aby zapewnić przestrzeganie praktyk odpowiedzialnego wdrażania sztucznej inteligencji.
Potencjalne zastosowania i możliwości Phi-3
Rodzina Phi-3 została zaprojektowana tak, aby wyróżniać się w scenariuszach, w których zasoby są ograniczone, niezbędne są małe opóźnienia lub priorytetem jest opłacalność. Modele te mogą potencjalnie umożliwiać wnioskowanie na urządzeniu, dzięki czemu aplikacje oparte na sztucznej inteligencji będą działać wydajnie na szerokiej gamie urządzeń, w tym na tych o ograniczonej mocy obliczeniowej. Mniejszy rozmiar modeli Phi-3 może również sprawić, że dostrajanie i dostosowywanie stanie się bardziej przystępne dla firm, umożliwiając im dostosowanie modeli do konkretnych zastosowań bez ponoszenia wysokich kosztów.
W zastosowaniach, w których krytyczny jest szybki czas reakcji, modele Phi-3 stanowią obiecujące rozwiązanie. Ich zoptymalizowana architektura i wydajne przetwarzanie mogą umożliwić szybkie generowanie wyników, poprawiając doświadczenia użytkowników i otwierając możliwości interakcji ze sztuczną inteligencją w czasie rzeczywistym. Dodatkowo, duże możliwości rozumowania i logiki Phi-3-mini sprawiają, że dobrze nadaje się do zadań analitycznych, takich jak analiza danych i generowanie spostrzeżeń.