Connect with us

Sztuczna inteligencja

Otwarte AI kontratakuje z modelem Llama 4 od Meta

mm

W ciągu ostatnich kilku lat świat AI przeszedł od kultury otwartej współpracy do dominacji ściśle strzeżonych systemów własnościowych. OpenAI – firma założona dosłownie z „otwartym” w nazwie – zmieniła swoje najpotężniejsze modele na tajne po 2019 roku. Konkurenci tacy jak Anthropic i Google podobnie zbudowali najnowocześniejsze AI za murami API, dostępnymi tylko na ich warunkach. Ten zamknięty podejście zostało uzasadnione częściowo przez interesy bezpieczeństwa i biznesu, ale pozostawiło wiele w społeczności lamentujących utratę ducha otwartego źródła. 

Teraz ten duch powraca. Nowo wydany model Llama 4 od Meta sygnalizuje śmiałą próbę ożywienia otwartego źródła AI na najwyższym poziomie – i nawet tradycyjnie strzeżone podmioty zwracają na to uwagę. CEO OpenAI, Sam Altman, niedawno przyznał, że firma była „po niewłaściwej stronie historii” w kwestii otwartych modeli i ogłosił plany nowego, potężnego otwartego modelu GPT-4. Innymi słowy, otwarte AI kontratakuje, a znaczenie i wartość „otwartego” ewoluują.

(Source: Meta)

Llama 4: Otwarty wyzwanie Meta dla GPT-4o, Claude i Gemini

Meta przedstawił Llama 4 jako bezpośrednie wyzwanie dla nowych modeli od potentatów AI, pozycjonując go jako otwarty model alternatywny. Llama 4 jest dostępny w dwóch wersjach – Llama 4 Scout i Llama 4 Maverick – z imponującymi specyfikacjami technicznymi. Oba są modelem mieszania ekspertów (MoE), które aktywują tylko ułamek parametrów na zapytanie, umożliwiając ogromny rozmiar bez zgniatających kosztów czasu wykonywania. Scout i Maverick dysponują każdy 17 miliardami „aktywnych” parametrów (części, która działa na dane wejściowe), ale dzięki MoE, Scout rozkłada je na 16 ekspertów (109 miliardów parametrów łącznie) i Maverick na 128 ekspertów (400 miliardów łącznie). Wynik: modele Llama 4 dostarczają potężne wyniki – i robią to z unikalnymi zaletami, których brakuje nawet niektóre zamknięte modele.

Na przykład Llama 4 Scout posiada przodujące w branży 10 milionów tokenów okna kontekstowego, znacznie przekraczające większość rywali. Oznacza to, że może on pochłonąć i rozumu nad ogromnymi dokumentami lub bazami kodu w jednym przejściu. Pomimo swojej skali, Scout jest wystarczająco wydajny, aby działać na jednym procesorze H100 GPU, gdy jest silnie kwantyzowany, sugerując, że deweloperzy nie będą musieli używać superkomputera, aby eksperymentować z nim. 

Tymczasem Llama 4 Maverick jest dostrojony do maksymalnej mocy. Wczesne testy pokazują, że Maverick równa się lub przewyższa najlepsze zamknięte modele w zadaniach rozumu, kodowania i wizji. W rzeczywistości Meta już zdradza, że pracuje nad jeszcze większym modelem, Llama 4 Behemoth, który jest wciąż w trakcie szkolenia i który wewnętrznie „przewyższa GPT-4.5, Claude 3.7 Sonnet i Gemini 2.0 Pro w kilku benchmarkach STEM.” Wiadomość jest jasna: modele otwarte nie są już drugiej kategorii; Llama 4 jest skierowana na najwyższy poziom.

Równie ważne jest to, że Meta udostępnił Llama 4 do pobrania i użycia natychmiast. Deweloperzy mogą pobrać Scout i Maverick ze strony oficjalnej lub Hugging Face pod licencją Llama 4 Community. Oznacza to, że każdy – od hakera w garażu po firmę z listy Fortune 500 – może zajrzeć pod maskę, dostroić model do swoich potrzeb i wdrożyć go na własnym sprzęcie lub w chmurze. To jest wyraźny kontrast do ofert własnościowych, takich jak GPT-4o od OpenAI lub Claude 3.7 od Anthropic, które są dostarczane za pomocą płatnych API bez dostępu do podstawowych wag. 

Meta podkreśla, że otwartość Llama 4 jest o tym, by umożliwić użytkownikom: „Udostępniamy pierwsze modele w stadzie Llama 4, co pozwoli ludziom na budowanie bardziej personalizowanych wielomodalnych doświadczeń.” Innymi słowy, Llama 4 jest zestawem narzędzi, który ma trafić w ręce deweloperów i badaczy na całym świecie. Wydając modele, które mogą rywalizować z GPT-4 i Claude pod względem zdolności, Meta ożywia ideę, że najlepsze AI nie muszą mieszkać za płatną bramką.

(Source: Meta)

Czy to autentyczny ideał, czy strategiczny ruch?

Meta przedstawia Llama 4 w wielkich, prawie altruistycznych słowach. „Nasz model AI open source, Llama, został pobrany ponad miliard razy,” ogłosił niedawno CEO Mark Zuckerberg ogłosił niedawno, dodając, że „udostępnianie modeli AI open source jest niezbędne, aby zapewnić ludziom na całym świecie dostęp do korzyści AI.” To ustawienie maluje Meta jako pioniera demokratyzacji AI – firmy, która jest skłonna udostępnić swoje najlepsze modele dla dobra ogólnego. I rzeczywiście, popularność rodziny Llama potwierdza to: modele zostały pobrane w oszałamiającej skali (przeskakując z 650 milionów do 1 miliarda pobrań w zaledwie kilka miesięcy), a są już używane w produkcji przez firmy takie jak Spotify, AT&T i DoorDash.

Meta z dumą zauważa, że deweloperzy doceniają „przejrzystość, dostosowywalność i bezpieczeństwo” posiadania otwartych modeli, które mogą uruchomić sami, co „pomaga osiągnąć nowe poziomy kreatywności i innowacji,” w porównaniu z czarnymi skrzynkami API. W zasadzie, brzmi to jak stara etyka oprogramowania open source (podobna do Linuxa lub Apache) stosowana do AI – niezmiennie wygrana dla społeczności.

Jednak nie można zignorować strategicznych kalkulacji za tą otwartością. Meta nie jest organizacją charytatywną, a „open source” w tym kontekście przychodzi z zastrzeżeniami. Zauważalne jest, że Llama 4 jest wydany pod specjalną licencją społeczności, a nie standardową licencją permissive – więc chociaż wagi modelu są darmowe do użycia, istnieją ograniczenia (na przykład pewne przypadki użycia o wysokich zasobach mogą wymagać pozwolenia, a licencja jest „własnościowa” w tym sensie, że jest opracowana przez Meta). To nie jest Open Source Initiative (OSI) zatwierdzona definicja open source, co doprowadziło do tego, że niektórzy krytycy twierdzą, że firmy nadużywają tego terminu. 

W praktyce podejście Meta jest często opisywane jako „open-weight” lub „source-available” AI: kod i wagi są otwarte, ale Meta nadal utrzymuje pewną kontrolę i nie ujawnia wszystkiego (danych szkoleniowych, na przykład). To nie zmniejsza użyteczności dla użytkowników, ale pokazuje, że Meta jest strategicznie otwarta – trzymając wystarczająco wodze, aby chronić siebie (i być może swoją przewagę konkurencyjną). Wiele firm kładzie etykietkę „open source” na modele AI, jednocześnie ukrywając kluczowe szczegóły, podważając prawdziwy duch otwartości.

Dlaczego Meta w ogóle otwiera się? Krajobraz konkurencyjny daje wskazówki. Udostępnianie potężnych modeli za darmo może szybko zbudować szeroką bazę deweloperów i przedsiębiorstw – Mistral AI, francuski startup, zrobił dokładnie to z jego wczesnymi otwartymi modelami, aby zyskać wiarygodność jako laboratorium pierwszej klasy. 

Udostępniając rynek Llama, Meta zapewnia, że jego technologia staje się podstawowa w ekosystemie AI, co może przynieść długoterminowe korzyści. To klasyczna strategia „objęcia i rozszerzenia”: jeśli każdy używa twojego „otwartego” modelu, pośrednio ustawiasz standardy i być może kierujesz ludzi w stronę twoich platform (na przykład, produkty asystentów AI Meta wykorzystują Llama). Istnieje również element PR i pozycjonowania. Meta gra rolę życzliwego innowatora, szczególnie w porównaniu z OpenAI – które spotkało się z krytyką za swój zamknięty podejście. W rzeczywistości, zmiana serca OpenAI w kwestii otwartych modeli podkreśla, jak skuteczny był ruch Meta. 

Po przełomowym chińskim otwartym modelu DeepSeek-R1, który pojawił się w styczniu i przeskoczył poprzednie modele, Altman wskazał, że OpenAI nie chce być „po niewłaściwej stronie historii”. Teraz OpenAI obiecuje otwarty model z silnymi zdolnościami rozumowania w przyszłości, co oznacza zmianę postawy. Trudno nie dostrzec wpływu Meta w tej zmianie. Otwarte pozycjonowanie Meta jest zarówno autentyczne, i strategiczne: rzeczywiście rozszerza dostęp do AI, ale jest to również sprytny manewr, aby wyprzedzić rywali i ukształtować przyszłość rynku na warunkach Meta.

Wnioski dla deweloperów, przedsiębiorstw i przyszłości AI

Dla deweloperów, odrodzenie się otwartych modeli jak Llama 4 jest odświeżeniem. Zamiast być zamkniętym w ekosystemie jednego dostawcy i opłatach, teraz mają opcję uruchomienia potężnego AI na własnej infrastrukturze lub dostosowania go swobodnie. 

To jest ogromna korzyść dla przedsiębiorstw w wrażliwych branżach – myśl o finansach, opiece zdrowotnej czy rządzie – które są niepewne, czy powinny wprowadzać poufne dane do czyjejś czarnej skrzynki. Z Llama 4, bank lub szpital mogą wdrożyć model językowy najwyższej klasy za własnym firewallem, dostosowując go do własnych danych, bez udostępniania jednego tokenu zewnętrznej jednostce. Istnieje również korzyść kosztowa. Podczas gdy opłaty za użycie najlepszych modeli API mogą gwałtownie wzrosnąć, otwarty model nie ma opłat za użycie – płacisz tylko za moc obliczeniową, aby go uruchomić. Firmy, które zwiększają obciążenie AI, mogą znacznie zaoszczędzić, wybierając otwarte rozwiązanie, które mogą skalować wewnętrznie.

Nie jest zaskoczeniem, że widzimy coraz większe zainteresowanie otwartymi modelami ze strony przedsiębiorstw; wiele z nich zaczęło zdawać sobie sprawę, że kontrola i bezpieczeństwo otwartego AI są lepiej dopasowane do ich potrzeb niż usługi zamknięte.

Deweloperzy również czerpią korzyści w postaci innowacji. Z dostępem do wnętrza modelu, mogą dostosować i poprawić AI dla niszowych dziedzin (prawo, biotechnologia, języki regionalne – wybierz) w sposób, który zamknięte API mogłoby nigdy nie obsłużyć. Eksplozja społecznościowych projektów wokół wcześniejszych modeli Llama – od botów czatu dostosowanych do wiedzy medycznej po aplikacje na telefon komórkowy uruchamiające miniaturowe wersje – udowodniła, jak otwarte modele mogą demokratyzować eksperymenty. 

Jednak renesans otwartych modeli podnosi również trudne pytania. Czy „demokratyzacja” naprawdę występuje, jeśli tylko ci, którzy mają znaczne zasoby obliczeniowe, mogą uruchomić model o 400 miliardach parametrów? Chociaż Llama 4 Scout i Maverick obniżają poprzeczkę sprzętową w porównaniu z monolitycznymi modelami, nadal są to ciężkie modele – punkt, który nie umknął niektórym deweloperom, których komputery nie mogą ich obsłużyć bez pomocy chmury. 

Jest nadzieja, że techniki takie jak kompresja modelu, destylacja lub mniejsze warianty ekspertów spłyną moc Llama 4 do bardziej dostępnych rozmiarów. Innym problemem jest nadużycie. OpenAI i inni długo twierdzili, że wydanie potężnych modeli otwarcie może umożliwić nieuczciwym aktorom (do generowania dezinformacji, kodu malware itp.). 

Te obawy pozostają: otwarty model Claude lub GPT mogą być nadużywane bez filtrów bezpieczeństwa, które firmy egzekwują na swoich API. Z drugiej strony, zwolennicy twierdzą, że otwartość pozwala społeczności na identyfikację i naprawę problemów, czyniąc modele bardziej solidnymi i przejrzystymi w czasie niż jakikolwiek system tajny. Istnieją dowody, że społeczności otwartych modeli traktują bezpieczeństwo poważnie, rozwijając własne zabezpieczenia i dzieląc się najlepszymi praktykami – ale jest to ciągłe napięcie.

Coraz bardziej jasne jest, że zmierzamy ku hybrydowemu krajobrazowi AI, w którym modele otwarte i zamknięte współistnieją, wpływając na siebie nawzajem. Zamknięci dostawcy, tacy jak OpenAI, Anthropic i Google, nadal posiadają przewagę w absolutnej wydajności – na razie. W rzeczywistości, jak doniesiono na koniec 2024 roku, badania sugerują, że otwarte modele pozostawały około rok za najlepszymi zamkniętymi modelami pod względem zdolności. Ale ta luka zamyka się szybko. 

W dzisiejszym rynku „otwarte AI” nie oznacza już tylko projekty hobby lub starsze modele – jest to teraz serce strategii AI dla gigantów technologicznych i startupów. Wprowadzenie Llama 4 przez Meta jest potężnym przypomnieniem ewoluującej wartości otwartości. Jest to zarówno filozoficzne stanowisko na rzecz demokratyzacji technologii, jak i taktyczny ruch w wysokich stawkach bitwy branżowej. Dla deweloperów i przedsiębiorstw otwiera nowe drzwi do innowacji i autonomii, nawet gdy komplikuje decyzje nowymi kompromisami. A dla szerszego ekosystemu, budzi nadzieję, że korzyści AI nie zostaną zablokowane w rękach kilku korporacji – jeśli etyka open source może utrzymać swoją pozycję. 

Alex McFarland jest dziennikarzem i pisarzem zajmującym się sztuczną inteligencją, który bada najnowsze rozwoje w dziedzinie sztucznej inteligencji. Współpracował z licznymi startupami i wydawnictwami związanymi z sztuczną inteligencją na całym świecie.