Seria Futurysta

AI Rozwiązuje Problemy Erdősa. Co Dalej?

mm

LEDwie kilka miesięcy temu, pytanie wydawało się głównie filozoficzne: jeśli sztuczna inteligencja może pomóc rozwiązać otwarte problemy matematyczne, co się stanie z pojęciem ludzkiej genialności?

To pytanie już nie jest teoretyczne. Dwa niedawne rozwoje zaangażowane OpenAI i Google DeepMind sugerują, że AI przechodzi od asystenta matematycznego do uczestnika matematycznego. Nie w sensie zastępowania matematyków całkowicie, ale w bardziej precyzyjnym i ważnym sensie generowania, wyszukiwania, sprawdzania i czasem odkrywania argumentów, które mogą przetrwać ekspertów.

Pierwszy rozwój pochodził od OpenAI, który ogłosił, że wewnętrzny model rozumnego rozumowania osiągnął przełom w planarnej jednostce odległości, słynnym pytaniu postawionym przez Paula Erdősa w 1946 roku. Problem pyta, ile par punktów w płaszczyźnie może być dokładnie jednostka odległości. Przez dziesięciolecia, dominująca wiara była taka, że konstrukcje siatkowe są praktycznie optymalne. Model OpenAI znalazł nową rodzinę konstrukcji, która obaliła tę wiarę.

Drugi rozwój pochodził od badaczy Google DeepMind, którzy opublikowali artykuł zatytułowany “Rozwój badań matematycznych z wykorzystaniem AI-sterowanego formalnego wyszukiwania dowodów”. Ich system, AlphaProof Nexus, ocenił AI-sterowane generowanie dowodów na otwarte problemy badawcze i zgłosił, że jego najsilniejszy agent samodzielnie rozwiązał 9 z 353 otwartych problemów Erdősa. Udowodnił również 44 z 492 otwartych koniunktur z Online Encyklopedii Ciągów Całkowitych.

Te wyniki razem oznaczają zmianę. Ważna historia nie jest taka, że AI nagle rozwiązało matematykę. Nie zrobiło. Ważna historia jest taka, że systemy AI zaczynają działać wewnątrz samej pętli badawczej.

Dlaczego Problemy Erdősa Są Poważnym Testem Dla AI

Paul Erdős był jednym z najbardziej płodnych matematyków w historii, a problemy związane z jego pracą zajmują specjalne miejsce w matematyce. Wiele z nich jest łatwych do sformułowania, trudnych do rozwiązania i połączonych z głębokimi obszarami, takimi jak kombinatoryka, teoria liczb, teoria grafów i geometria dyskretna.

To sprawia, że są one niezwykle użyteczne jako benchmark dla AI-owego rozumowania. Nie są ćwiczeniami szkolnymi. Nie są również gigantycznymi, teorią burzącymi koniunkturami, takimi jak hipoteza Riemanna. Zamiast tego wiele problemów Erdősa leży w połowie, gdzie postęp zależy od znalezienia odpowiedniego połączenia, odpowiedniej konstrukcji lub odpowiednio pominiętego lematu.

To jest dokładnie tam, gdzie AI może być najbardziej przydatne na początku. Współczesne systemy rozumowania nie są tylko kalkulatorami. Mogą one badać wiele możliwych ścieżek dowodowych, porównywać częściowe strategie, pobierać odległe idee z sąsiednich pól i testować, czy argument może być uczyniony rygorystycznym.

Wynik OpenAI jest uderzający, ponieważ model nie tylko wygładził znaną trasę. Znaleziono nieoczekiwaną przeprawę między geometrią dyskretną a teorią liczb algebraicznych. To jest rodzaj konceptualnego skoku, który matematycy zwykle kojarzą z prawdziwą kreatywnością.

OpenAI i Przełom W Jednostce Odległości

Problem planarnej jednostki odległości jest prosty do opisania. Umieść n punktów w płaszczyźnie. Zliczaj, ile par punktów jest dokładnie jednostka odległości. Celem jest zrozumienie, jak duży może być ten zliczany wynik, gdy n rośnie.

Przez prawie 80 lat, matematycy podejrzewali, że najlepsze konstrukcje nie będą dramatycznie przewyższać układów siatkowych. Model OpenAI zakwestionował to założenie, produkując nieskończoną rodzinę przykładów, które pokonały oczekiwany limit o poprawę wielomianową.

To ma znaczenie z dwóch powodów. Po pierwsze, zmienia to matematyczny obraz. Sugestywnie, że konstrukcje teoretyczne liczb mogą mieć więcej do wniesienia do geometrii dyskretnej, niż wielu badaczy założyło. Po drugie, zmienia to obraz AI. Model ten został opisany jako ogólny model rozumowania, a nie system zbudowany tylko dla tego konkretnego problemu.

Innymi słowy, system wydaje się przenosić moc rozumowania do nieznanej sytuacji badawczej. Nie po prostu zapamiętał znanego dowodu. Wygenerował wynik, który zewnętrzni matematycy traktowali jako główny wkład.

Google DeepMind i Formalne Wyszukiwanie Dowodów

Artykuł Google DeepMind zajmuje się innym, ale równie ważnym pytaniem: jak AI-matematyka może być uczyniona niezawodną?

Modele językowe mogą produkować eleganckie argumenty, które zawierają subtelne błędy. W normalnym tekście, te błędy mogą być trudne do wykrycia. W matematyce, jeden błędny krok może unieważnić cały dowód. Dlatego formalne systemy dowodowe, takie jak Lean, mają znaczenie. Lean nie dba o to, czy argument brzmi przekonywająco. Każdy logiczny krok musi być sprawdzony.

AlphaProof Nexus wykorzystuje to ograniczenie jako część przepływu pracy. Agenci AI generują próby dowodów w Lean, otrzymują informacje zwrotne od kompilatora, modyfikują swój podejście i kontynuują wyszukiwanie. Silniejsza wersja koordynuje subagentów i wykorzystuje bardziej zaawansowane narzędzia dowodowe, aby skupić wyszukiwanie.

Rozwój Metoda AI Dlaczego To Ma Znaczenie
Wynik OpenAI w jednostce odległości Ogólny model rozumowania Pokazał, że AI może wyprodukować oryginalną konstrukcję dla słynnego otwartego problemu
Google DeepMind AlphaProof Nexus LLM-kierowane wyszukiwanie dowodów Lean Pokazał, że AI może formalnie rozwiązać wiele otwartych problemów Erdősa
Weryfikacja formalnego dowodu Logika sprawdzona przez kompilator Redukuje ryzyko przekonywającego, ale nieważnego matematycznego wyjścia

Wynik DeepMind jest szczególnie ważny, ponieważ łączy AI-owe rozumowanie z weryfikacją. System nie musi być ufały w tym samym sposób, w jaki musi być ufały chatbot językowy. Jego dowód albo skompiluje, albo nie.

Co To Znaczy Dla Badań Matematycznych

Bieżąca lekcja nie jest taka, że matematycy są przestarzali. Jest taka, że wąskie gardło w matematyce może się zmieniać.

Historycznie, badacz musiał zrobić prawie wszystko: sformułować problem, przeglądnąć literaturę, przetestować pomysły, zbudować dowód, sprawdzić każdy krok i skomunikować wynik. AI teraz zagraża redystrybucji tej pracy. Niektóre części przepływu pracy mogą stać się szybsze, tańsze i bardziej zautomatyzowane.

  • AI może badać wiele tras dowodowych, zanim człowiek poświęci czas na jedną.
  • Formalne systemy mogą weryfikować kroki, które w przeciwnym razie wymagałyby powolnej ekspertowej kontroli.
  • Badacze mogą wykorzystywać AI do wyszukiwania w odległych matematycznych podpolach.

To może wyprodukować nowy styl badań. Zamiast prosić AI o odpowiedź, matematycy mogą coraz częściej nadzorować floty agentów dowodowych. Rola ludzka staje się mniej jak kalkulator i bardziej jak dyrektor badań: wybieranie odpowiednich problemów, interpretowanie wyników, wykrywanie znaczenia koncepcyjnego i decydowanie, które ścieżki zasługują na głębszą uwagę.

Granice Nadal Są Rzeczywiste

Ważne jest, aby nie przesadzać z momentem. System Google DeepMind rozwiązał 9 z 353 próbowanych problemów Erdősa. To jest imponujące, ale oznacza to również, że większość pozostała nierozwiązana. Wynik OpenAI w jednostce odległości jest kamieniem milowym, ale nie oznacza to, że każda słynna koniunktura jest teraz w zasięgu ręki.

Systemy AI nadal mają trudności, gdy problem wymaga nowej ramy konceptualnej, gdy odpowiednia matematyka jest słabo sformalizowana, lub gdy dowód zależy od długich łańcuchów spostrzeżeń, które nie mogą być łatwo rozłożone na wyszukiwalne kroki. Biblioteki formalnych dowodów są również nierównomiernie rozwinięte. Obszary z dojrzałym pokryciem Lean są bardziej dostępne dla agentów AI niż obszary, gdzie materiał podstawowy wciąż musi być zakodowany.

  • Systemy pozostają zależne od ludzkiego wyboru problemu i interpretacji.
  • Sformalizowanie może być trudne, gdy definicje są niejasne lub niedorozwinięte.
  • Próby dowodów AI mogą nadal ukrywać ciężką pracę wewnątrz niesprawdzonych twierdzeń pomocniczych.

Te granice nie są porażkami. Wyjaśniają, gdzie muszą nastąpić następne postępy. Lepsze agenci dowodowi, bogatsze biblioteki formalne, silniejsze przepływy weryfikacji i bardziej skuteczne interfejsy ludzko-AI będą wszystkie miały znaczenie.

Co Następuje Po Rozwiązaniu Problemów Erdősa Przez AI?

Najbardziej prawdopodobna bliska przyszłość nie jest jednym dramatycznym momentem, w którym AI rozwiązuje całą matematykę. Jest to stopniowe rozszerzanie badań wspomaganych przez AI do dziedzin z czystymi sformułowaniami problemów, silnymi bibliotekami formalnymi i dużymi zbiorami rozproszonych wcześniejszych prac.

Kombinatoryka, teoria grafów, teoria liczb, optymalizacja i geometria dyskretna są naturalnymi wczesnymi celami. Te pola często zawierają problemy, w których pytanie jest zwięzłe, ale rozwiązanie zależy od szycia razem pomysłów z odległych miejsc. AI jest dobrze przystosowana do tego rodzaju wyszukiwania.

W czasie, ten sam wzorzec może się rozciągać poza matematykę. Jeśli model może utrzymać trudny argument, przetestować roszczenia pośrednie i połączyć idee z różnych pól, te możliwości mają znaczenie w fizyce, biologii, nauce o materiałach, kryptografii i badaniach AI samej w sobie.

Głębsza konsekwencja jest kulturowa. Matematyka zawsze ceniła dowód, ale ceniła również smak: umiejętność wiedzy, które pytanie ma znaczenie, które abstrakcje są warte wynalezienia i które wyniki zmieniają kształt pola. Gdy wyszukiwanie dowodów staje się bardziej zautomatyzowane, smak może stać się jeszcze ważniejszy, a nie mniej.

Wnioski: Genialność Przesuwa Się W Górę

Odpowiedź na wcześniejsze pytanie jest teraz wyraźniejsza. Jeśli AI może rozwiązać otwarte problemy matematyczne, ludzka genialność nie znika. Przesuwa się w górę.

Rzadka umiejętność nie będzie umiejętnością przetrwania każdego technicznego kroku samotnie. Będzie umiejętnością zadawania odpowiednich pytań, ramowania odpowiednich abstrakcji, oceny znaczenia wyników odkrytych przez maszynę i kierowania systemami AI w stronę problemów, które mają znaczenie.

Przełom OpenAI w jednostce odległości i wyniki formalnego wyszukiwania dowodów Google DeepMind nie zamykają książki na ludzką kreatywność matematyczną. Otwierają nowy rozdział, w którym matematycy mogą pracować z systemami, które mogą badać teren szybciej niż jeden umysł.

Przyszłość matematyki może nie należeć do ludzi ani maszyn samotnie. Może należeć do badaczy, którzy uczą się, jak sprawić, by obie myślały razem.

Daniel jest wielkim zwolennikiem tego, jak AI ostatecznie zakłóci wszystko. On żyje technologią i żyje, by próbować nowe gadżety.