Umělá inteligence
Roztržená inteligence: Proč AI systémy excelují v olympijských problémech, ale selhávají ve školské matematice

Komunita umělé inteligence oslavila pozoruhodný milník v roce 2025, kdy cả Google DeepMind a OpenAI systémy dosáhly zlaté medaile na Mezinárodní matematické olympiádě. Tyto modely AI řešily problémy, které mohli zvládnout pouze několika málo z nejchytřejších mladých matematiků na světě. Přesto tyto stejné systémy často selhávají, když jsou požádány o provedení základních aritmetických operací, které může zvládnout s lehkostí jakýkoli střední školák. Tento pozoruhodný paradox odhaluje něco fundamentálního o povaze umělé inteligence dnes. Svědky jsme vzniku toho, co lze nazvat roztrženou inteligencí, kde stroje vykazují nadlidské schopnosti v určitých oblastech, zatímco selhávají v úkolech, které považujeme za elementární.
Vítězství na olympiádě
Mezinárodní matematická olympiáda je vedoucím standardem v předuniverzitních matematických soutěžích. Každý rok se nejchytřejší mladí matematici z celého světa snaží vyřešit šest problémů, které vyžadují hluboké pochopení, kreativní myšlení a vysoké úrovni důkazů. V roce 2025 získaly systémy AI z obou Google DeepMind a OpenAI 35 bodů z 42, což stačilo k získání zlaté medaile. AlphaGeometry 2 od DeepMindu vyřešil složitý geometrický problém za pouhých 19 sekund, zatímco AlphaProof vyřešil problémy v teorii čísel a algebře, které většinu lidských soutěžících zaskočily.
Tyto úspěchy navazují na roky postupného pokroku. Systémy používají formální matematické jazyky, jako je Lean, k vytváření přísných důkazů. Používají techniky, jako je curriculum learning, kde se AI trénuje na problémech rostoucí obtížnosti. Tento trénink umožňuje AI pochopit komplexní vztahy mezi matematickými objekty, rozpoznat jemné vzory a vytvořit elegantní důkazy.
Boj s elementárními úkoly
Tytéž systémy AI, které dosáhly zlaté medaile na olympijských problémech, často selhávají v úkolech, které se zdají triviální. Pokud je například požádáte, aby vynásobily velká čísla, mohou s jistotou produkovat nesprávné odpovědi. Podobně, pokud se pokusíte provést jiné základní aritmetické operace, jejich výkon se stává nepředvídatelným. Problém není omezen pouze na jednoduché výpočty. Tyto systémy často bojují se slovními úkoly, které vyžadují sledování více množství, pochopení reálného kontextu nebo aplikaci základních matematických operací v sekvenci.
Tato slabost v podstatě pramení z toho, jak tyto modely AI fundamentálně fungují. Velké jazykové modely předpovídají, jaký text by měl následovat na základě vzorů, které viděly ve trénovacích datech. Když narazí na “2 + 2”, rozpoznají tento vzor a správně předpoví “4” ne proto, že by rozuměli přidání, ale protože tato sekvence se objevuje nesčetnékrát ve jejich trénovacích datech. Když jim předložíte neobvyklé výpočty, které se zřídka objevují v textu, jejich výkon se rychle zhoršuje. Jsou v podstatě stroji pro rozpoznávání vzorů, které excelují, když vzory jsou jasné a konzistentní, ale bojují, když jsou nuceny vypočítat neviditelný problém.
Architektonická paradoxie
Rozpor mezi olympijským úspěchem a aritmetickým selháním odhaluje hlubší architektonický problém. Moderní systémy AI excelují v problémech, které lze řešit pomocí rozpoznávání vzorů, logického vyvozování a systematického prohledávání prostoru řešení. Olympijské problémy, navzdory jejich obtížnosti, často mají elegantní struktury, které AI může využít. Systémy mohou prozkoumat různé strategie důkazů, ověřit logické kroky a stavět na zavedených matematických rámcích. Operují ve světě symbolů a pravidel, kde dominuje konzistence a logika.
Naopak základní aritmetika, paradoxně, představuje odlišné výzvy. Vyžaduje přesnou manipulaci s množstvím, ne rozpoznávání vzorů. Vyžaduje pochopení numerické velikosti a vztahů, které nelze aproximovat. Když se AI systém přiblíží k aritmetice prostřednictvím jazykového modelování, zachází s čísly jako s tokeny, které je třeba předpovídat, spíše než s množstvím, která je třeba vypočítat. Tento fundamentální nesoulad mezi požadavky úkolu a architekturou modelu vytváří mezery ve výkonu, které pozorujeme.
Trénovací data a jejich omezení
Schopnosti AI závisí do značné míry na kvalitě a povaze trénovacích dat. Matematické důkazy a pokročilé problémy se často objevují ve well-strukturovaných formátech online. Akademické články, učebnice a vzdělávací zdroje poskytují jasně formulované příklady matematického uvažování. Internet obsahuje rozsáhlé diskuse o matematických konceptech, technikách důkazů a strategiích řešení problémů. Tento bohatý korpus umožňuje systémům AI se učit pokročilému matematickému myšlení.
Elementární matematika však trpí odlišným problémem. Zatímco základní aritmetika se často objevuje online, zřídka je doprovázena podrobným vysvětlením základních procesů, které pomáhají AI pochopit. Jednoduché výpočty jsou uvedeny jako fakta, spíše než vysvětlena jako postupy. Trénovací data obsahují výsledky výpočtů, ale ne samotný výpočetní proces. To vytváří fundamentální mezeru v pochopení, která se projevuje jako špatný výkon na základních úkolech.
Implikace pro vývoj AI
Tento nerovnoměrný vzorec inteligence má zásadní implikace pro způsob, jakým navrhujeme a používáme systémy AI. Nemůžeme předpokládat, že úspěch v komplexních úkolech znamená kompetenci v jednodušších úkolech. AI schopný prokázat matematické teorie může selhat při vyrovnání checkbooku. Systém, který píše počítačový kód, může mít potíže s základním počítáním. Tato realita vyžaduje pečlivé zvažování schopností a omezení AI v reálných aplikacích.
Tento jev také odhaluje důležitost hybridních přístupů. Místo toho, abychom očekávali, že jeden model zvládne každý úkol, možná budeme potřebovat specializované systémy pro různé typy úkolů. Například kombinace symbolických výpočtů pro aritmetiku s jazykovými modely pro uvažování by mohla vytvořit více spolehlivá řešení. Budoucnost AI může spočívat v koordinaci více specializovaných systémů spíše než v pronásledování monolitické obecné inteligence.
Cesta vpřed
Rozpoznání roztržené inteligence poskytuje jasnější směr pro budování více schopných systémů AI. Výzkumníci vyvíjejí metody pro integraci výpočetních nástrojů do jazykových modelů, umožňujících jim delegovat aritmetiku na kalkulačky. Nové trénovací strategie se zaměřují na učení modelů, kdy použít externí nástroje místo pokusu o internalizaci každé dovednosti. Tento přístup odráží lidskou inteligenci, kde se spoléháme na kalkulačky pro výpočet a rezervujeme naší mentální úsilí pro vyšší úroveň uvažování.
Paradox roztržené inteligence nás nakonec učí pokorou o umělé inteligenci. Tyto systémy nejsou univerzálně nadřazené ani uniformně omezené. Místo toho vykazují komplexní směs silných a slabých stránek, kterých si musíme být vědomi, abychom mohli efektivně využívat a zlepšovat schopnosti AI. Úspěch vyžaduje nejen rozšiřování toho, co AI může dělat, ale také řešení jeho fundamentálních mezer. Stroje, které mohou prokázat teorie, ale selhat v základním přidání, ukazují, že inteligence, ať už umělá nebo lidská, zůstává multifacetedním jevem, který není snadné definovat.
Shrnutí
Úspěch AI při řešení olympijských problémů, ale selhání ve školské matematice, ukazuje, že inteligence se nevyvíjí rovnoměrně. Tyto systémy mohou být brilantní v jedné oblasti a slabé v jiné. Pochopení tohoto nerovnoměrného vzoru je důležité pro to, jak navrhujeme a používáme systémy AI. Místo toho, abychom očekávali, že jeden model zvládne všechno, možná budeme potřebovat kombinovat různé přístupy, které využijí silné stránky každého systému. Skutečný pokrok bude pocházet z budování AI, která funguje spolehlivě v praxi, ne z předpokladu, že bude dobrá ve všech úkolech.












