Kontakt z nami

Sztuczna inteligencja ogólna

AlphaEvolve: przełomowy krok Google DeepMind w kierunku AGI

mm

Google DeepMind zaprezentował AlfaEvolve, ewolucyjny agent kodujący zaprojektowany do autonomicznego odkrywania nowych algorytmów i rozwiązań naukowych. Przedstawiono w artykule zatytułowanym "AlphaEvolve: Agent kodujący do odkryć naukowych i algorytmicznych" badania te stanowią krok milowy w kierunku Sztuczna ogólna inteligencja (AGI) i nawet Sztuczna superinteligencja (ASI)Zamiast polegać na statycznym dostrajaniu lub zestawach danych oznaczonych przez człowieka, AlphaEvolve obiera zupełnie inną ścieżkę — taką, która koncentruje się na autonomicznej kreatywności, innowacjach algorytmicznych i ciągłym samodoskonaleniu.

Sercem AlphaEvolve jest autonomiczny proces ewolucyjny zasilany przez duże modele językowe (LLM). Ten potok nie tylko generuje wyniki — on mutuje, ocenia, wybiera i ulepsza kod w kolejnych generacjach. AlphaEvolve zaczyna od początkowego programu i iteracyjnie go udoskonala, wprowadzając starannie ustrukturyzowane zmiany.

Zmiany te przybierają formę różnic generowanych przez LLM — modyfikacji kodu sugerowanych przez model języka na podstawie wcześniejszych przykładów i wyraźnych instrukcji. „Diff” w inżynierii oprogramowania odnosi się do różnicy między dwiema wersjami pliku, zazwyczaj podświetlając wiersze do usunięcia lub zastąpienia oraz nowe wiersze do dodania. W AlphaEvolve LLM generuje te różnice, analizując bieżący program i proponując niewielkie zmiany — dodając funkcję, optymalizując pętlę lub zmieniając hiperparametr — na podstawie monitu, który obejmuje metryki wydajności i wcześniejsze udane zmiany.

Każdy zmodyfikowany program jest następnie testowany przy użyciu zautomatyzowanych ewaluatorów dostosowanych do zadania. Najbardziej efektywni kandydaci są przechowywani, odwoływani i rekombinowani jako inspiracja dla przyszłych iteracji. Z czasem ta ewolucyjna pętla prowadzi do powstawania coraz bardziej wyrafinowanych algorytmów — często przewyższających te zaprojektowane przez ekspertów-ludzi.

Zrozumienie nauki stojącej za AlphaEvolve

W swojej istocie AlphaEvolve opiera się na zasadach obliczenia ewolucyjne—poddziedzina sztucznej inteligencji inspirowana ewolucją biologiczną. System zaczyna od podstawowej implementacji kodu, który traktuje jako początkowy „organizm”. Przez pokolenia AlphaEvolve modyfikuje ten kod — wprowadzając wariacje lub „mutacje” — i ocenia dopasowanie każdej wariacji, używając dobrze zdefiniowanej funkcji punktacji. Najlepiej działające warianty przeżywają i służą jako szablony dla następnego pokolenia.

Pętla ewolucyjna jest koordynowana poprzez:

  • Szybkie pobieranie próbek: AlphaEvolve tworzy monity, wybierając i osadzając wcześniej pomyślnie wykonane przykłady kodu, metryki wydajności i instrukcje specyficzne dla danego zadania.
  • Mutacja kodu i propozycja: System korzysta z kombinacji wydajnych programów LLM — Gemini 2.0 Flash i Pro — w celu generowania konkretnych modyfikacji w bieżącej bazie kodu w formie różnic.
  • Mechanizm oceny: Zautomatyzowana funkcja oceny analizuje wyniki każdego kandydata, wykonując go i zwracając skalarne wyniki.
  • Baza danych i kontroler: Rozproszony kontroler koordynuje tę pętlę, przechowując wyniki w ewolucyjnej bazie danych i równoważąc eksplorację z eksploatacją poprzez mechanizmy takie jak MAP-Elites.

Ten bogaty w informacje zwrotne, zautomatyzowany proces ewolucyjny radykalnie różni się od standardowych technik dostrajania. Umożliwia AlphaEvolve generowanie nowych, wydajnych i czasami kontrintuicyjnych rozwiązań — przesuwając granicę tego, co uczenie maszynowe może osiągnąć autonomicznie.

Porównanie AlphaEvolve do RLHF

Aby docenić innowacyjność AlphaEvolve, kluczowe jest porównanie jej z Uczenie się ze wzmocnieniem na podstawie informacji zwrotnych od ludzi (RLHF), dominujące podejście stosowane w celu dostrajania dużych modeli językowych.

W RLHF preferencje ludzkie są wykorzystywane do trenowania modelu nagrody, który kieruje procesem uczenia się LLM za pośrednictwem uczenie się wzmacniania algorytmy takie jak Proksymalna Optymalizacja Polityki (PPO)RLHF poprawia dopasowanie i użyteczność modeli, ale wymaga dużego zaangażowania człowieka w celu wygenerowania danych zwrotnych i zazwyczaj działa w statycznym, jednorazowym trybie dostrajania.

AlphaEvolve natomiast:

  • Usuwa z pętli sprzężenie zwrotne pochodzące od człowieka na rzecz ewaluatorów wykonywalnych przez maszynę.
  • Wspomaga ciągłą naukę poprzez ewolucyjną selekcję.
  • Eksploruje znacznie szersze przestrzenie rozwiązań dzięki mutacjom stochastycznym i asynchronicznemu wykonywaniu.
  • Potrafi generować rozwiązania, które nie tylko są spójne, ale także powieść i ma znaczenie naukowe.

Gdzie RLHF dostraja zachowanie, AlphaEvolve odkrywa oraz wymyślaTo rozróżnienie jest kluczowe przy rozważaniu przyszłych trajektorii w kierunku AGI: AlphaEvolve nie tylko formułuje lepsze przewidywania — ona znajduje nowe ścieżki do prawdy.

Zastosowania i przełomy

1. Odkrycia algorytmiczne i postęp matematyczny

AlphaEvolve wykazało swoją zdolność do dokonywania przełomowych odkryć w podstawowych problemach algorytmicznych. Przede wszystkim odkryło nowy algorytm mnożenia dwóch macierzy 4×4 o wartościach zespolonych przy użyciu zaledwie 48 mnożeń skalarnych — przewyższając wynik Strassena z 1969 r., który wynosił 49 mnożeń, i przełamując 56-letni pułap teoretyczny. AlphaEvolve osiągnęło to dzięki zaawansowanym technikom rozkładu tensorów, które rozwijało w wielu iteracjach, przewyższając kilka najnowocześniejszych podejść.

Oprócz mnożenia macierzy, AlphaEvolve wniósł znaczący wkład w badania matematyczne. Został oceniony w ponad 50 otwartych problemach z takich dziedzin jak kombinatoryka, teoria liczb i geometria. W około 75% przypadków odpowiadał najbardziej znanym wynikom, a w około 20% je przewyższał. Te sukcesy obejmowały ulepszenia problemu minimalnego nakładania się Erdősa, gęstsze rozwiązanie problemu liczby pocałunków w 11 wymiarach i bardziej wydajne konfiguracje pakowania geometrycznego. Wyniki te podkreślają jego zdolność do działania jako autonomicznego eksploratora matematycznego — udoskonalania, iterowania i rozwijania coraz bardziej optymalnych rozwiązań bez ingerencji człowieka.

2. Optymalizacja w całym stosie obliczeniowym Google

AlphaEvolve przyniósł również wymierne usprawnienia wydajności w całej infrastrukturze Google:

  • In harmonogramowanie centrum danychodkryto nową heurystykę, która usprawniła obsadzanie stanowisk pracy, odzyskując 0.7% wcześniej zablokowanych zasobów obliczeniowych.
  • Dla litu szacuje się Jądra szkoleniowe GeminiFirma AlphaEvolve opracowała lepszą strategię kafelkowania dla mnożenia macierzy, co pozwoliło na przyspieszenie działania jądra o 23% i ogólne skrócenie czasu szkolenia o 1%.
  • In Projekt obwodu TPU, zidentyfikowano uproszczenie logiki arytmetycznej na poziomie RTL (Register-Transfer Level), zweryfikowane przez inżynierów i uwzględnione w układach TPU nowej generacji.
  • Zoptymalizowano również kod FlashAttention wygenerowany przez kompilator dzięki edycji pośrednich reprezentacji XLA, co pozwoliło skrócić czas wnioskowania na procesorach GPU o 32%.

Łącznie wyniki te potwierdzają zdolność AlphaEvolve do działania na wielu poziomach abstrakcji — od matematyki symbolicznej po niskopoziomową optymalizację sprzętu — i zapewniają rzeczywisty wzrost wydajności.

  • Programowanie ewolucyjne: Paradigmat sztucznej inteligencji wykorzystujący mutację, selekcję i dziedziczenie w celu iteracyjnego udoskonalania rozwiązań.
  • Superoptymalizacja kodu: Automatyczne wyszukiwanie najbardziej efektywnej implementacji funkcji, często przynoszące zaskakujące, nieintuicyjne usprawnienia.
  • Ewolucja podpowiedzi meta: AlphaEvolve nie tylko rozwija kod; rozwija również sposób przekazywania instrukcji do LLM-ów, co pozwala na samodoskonalenie procesu kodowania.
  • Strata dyskretyzacji: Termin regularyzacji zachęcający do dostosowania wyników do wartości całkowitych lub półcałkowitych, co ma kluczowe znaczenie dla przejrzystości matematycznej i symbolicznej.
  • Utrata halucynacji: Mechanizm wprowadzający losowość do rozwiązań pośrednich, zachęcający do eksploracji i unikający lokalnych minimów.
  • Algorytm MAP-Elites: Rodzaj algorytmu różnorodności jakości, który utrzymuje zróżnicowaną populację wysoce wydajnych rozwiązań w różnych wymiarach funkcji, umożliwiając solidną innowację.

Konsekwencje dla AGI i ASI

AlphaEvolve to coś więcej niż optymalizator — to spojrzenie w przyszłość, w której inteligentni agenci mogą wykazać się kreatywną autonomią. Zdolność systemu do formułowania abstrakcyjnych problemów i projektowania własnych podejść do ich rozwiązywania stanowi znaczący krok w kierunku Sztucznej Inteligencji Ogólnej. Wykracza to poza przewidywanie danych: obejmuje to rozumowanie strukturalne, tworzenie strategii i dostosowywanie się do informacji zwrotnych — cechy charakterystyczne inteligentnego zachowania.

Jego zdolność do iteracyjnego generowania i udoskonalania hipotez sygnalizuje również ewolucję w sposobie uczenia się maszyn. W przeciwieństwie do modeli, które wymagają rozległych szkolenie nadzorowane, AlphaEvolve ulepsza się poprzez pętlę eksperymentów i ocen. Ta dynamiczna forma inteligencji pozwala mu poruszać się po złożonych przestrzeniach problemowych, odrzucać słabe rozwiązania i podnosić silniejsze bez bezpośredniego nadzoru człowieka.

Wykonując i weryfikując własne pomysły, AlphaEvolve funkcjonuje zarówno jako teoretyk, jak i eksperymentator. Wykracza poza wykonywanie wstępnie zdefiniowanych zadań i wkracza w sferę odkryć, symulując autonomiczny proces naukowy. Każda proponowana poprawa jest testowana, porównywana i ponownie integrowana — co pozwala na ciągłe udoskonalanie w oparciu o rzeczywiste wyniki, a nie statyczne cele.

Być może najbardziej zauważalne jest to, że AlphaEvolve jest wczesnym przykładem rekurencyjnego samodoskonalenia — gdzie system AI nie tylko uczy się, ale także ulepsza swoje komponenty. W kilku przypadkach AlphaEvolve ulepszyło infrastrukturę szkoleniową, która obsługuje jego własne modele bazowe. Chociaż nadal ograniczone przez obecne architektury, ta zdolność stanowi precedens. Z większą liczbą problemów ujętych w ocenialnych środowiskach, AlphaEvolve mogłoby skalować się w kierunku coraz bardziej wyrafinowanego i samooptymalizującego się zachowania — podstawowej cechy sztucznej superinteligencji (ASI).

Ograniczenia i przyszła trajektoria

Obecnym ograniczeniem AlphaEvolve jest jego zależność od zautomatyzowanych funkcji oceny. Ogranicza to jego użyteczność do problemów, które można sformalizować matematycznie lub algorytmicznie. Nie może jeszcze działać sensownie w domenach, które wymagają milczącego ludzkiego zrozumienia, subiektywnego osądu lub eksperymentów fizycznych.

Jednakże przyszłe kierunki obejmują:

  • Integracja hybrydowej oceny: połączenie rozumowania symbolicznego z ludzkimi preferencjami i krytyką języka naturalnego.
  • Wdrożenie w środowiskach symulacyjnych, umożliwiające przeprowadzanie eksperymentów naukowych.
  • Destylacja wyników ewolucji do bazowych modeli LLM, umożliwiająca tworzenie bardziej wydajnych i efektywniejszych pod względem próbki modeli podstawowych.

Te trajektorie wskazują na coraz bardziej agentywne systemy zdolne do autonomicznego rozwiązywania problemów o wysokim ryzyku.

Podsumowanie

AlphaEvolve to głęboki krok naprzód — nie tylko w narzędziach AI, ale także w naszym rozumieniu samej inteligencji maszyn. Łącząc ewolucyjne wyszukiwanie z rozumowaniem LLM i sprzężeniem zwrotnym, na nowo definiuje to, co maszyny mogą autonomicznie odkrywać. Jest to wczesny, ale znaczący sygnał, że samodoskonalące się systemy zdolne do prawdziwego myślenia naukowego nie są już teoretyczne.

Patrząc w przyszłość, architektura stanowiąca podstawę AlphaEvolve mogłaby być rekurencyjnie stosowana do samej siebie: rozwijając własne ewaluatory, ulepszając logikę mutacji, udoskonalając funkcje punktacji i optymalizując podstawowe potoki szkoleniowe dla modeli, od których jest zależna. Ta rekurencyjna pętla optymalizacyjna stanowi techniczny mechanizm bootstrappingu w kierunku AGI, gdzie system nie tylko wykonuje zadania, ale ulepsza samą infrastrukturę, która umożliwia mu uczenie się i rozumowanie.

Z czasem, w miarę jak AlphaEvolve skaluje się w bardziej złożonych i abstrakcyjnych domenach — a ludzka interwencja w proces maleje — może wykazywać przyspieszające zyski inteligencji. Ten samonapędzający się cykl iteracyjnej poprawy, stosowany nie tylko do problemów zewnętrznych, ale także do jego własnej struktury algorytmicznej, jest kluczowym teoretycznym składnikiem AGI i wszystkie korzyści, jakie może przynieść społeczeństwu. Dzięki połączeniu kreatywności, autonomii i rekurencji AlphaEvolve może być zapamiętany nie tylko jako produkt DeepMind, ale jako projekt pierwszych prawdziwie powszechnych i samorozwijających się sztucznych umysłów.

Antoine jest wizjonerskim liderem i partnerem założycielskim Unite.AI, napędzanym niezachwianą pasją do kształtowania i promowania przyszłości AI i robotyki. Jako seryjny przedsiębiorca wierzy, że AI będzie tak samo przełomowa dla społeczeństwa jak elektryczność i często zachwyca się potencjałem przełomowych technologii i AGI.

Jako futurysta, poświęca się badaniu, w jaki sposób te innowacje ukształtują nasz świat. Ponadto jest założycielem Securities.io, platforma skupiająca się na inwestowaniu w najnowocześniejsze technologie, które zmieniają przyszłość i przekształcają całe sektory.