Myslitelé
Proč Průmysl 5.0 potřebuje umělou obecnou inteligenci

Od: Bas Steunebrink, spoluzakladatel a ředitel umělé obecné inteligence, Eric Nivel, hlavní inženýr AGI & Jerry Swan, výzkumný pracovník ve společnosti NNAISENSE.
Bereme automatizaci jako samozřejmost v našem moderním světě, každý den těžíme z dodavatelských řetězců, které pokrývají celý svět a dodávají široký výběr zboží na naše regály. Ale za scénou generuje výroba a pohyb zboží mnoho optimalizačních problémů, jako je balení, plánování, směrování a automatizace montážní linky. Tyto optimalizační problémy jsou dynamické a neustále se mění v souladu s reálným světem. Například očekávané dodavatelské trasy mohou být náhle narušeny kvůli neočekávaným okolnostem – například může být zablokován Suezský průplav; letecké trasy se mohou změnit kvůli sopečným erupcím; celé země mohou být nedostupné kvůli konfliktu. Změny v legislativě, kolaps měny a vzácné zdroje jsou také příklady proměnných na straně dodavatele, které jsou neustále v pohybu.
Abychom poskytli další příklad, někdy je nutné začlenit nový komponent do stroje nebo pracovního postupu (uživatelé mohou chtít různé materiály nebo barvy, například). V současné době je vyžadována odborná lidská práce, aby se provedly změny v systému, nebo – v případě strojového učení – navíc přeškolit a znovu nasadit řešení. Podobným způsobem jsou “digitální dvojčata” Průmyslu 4.0 stále silně závislá na představě, že popis problému a distribuce vstupů lze specifikovat jednou a navždy v okamžiku počáteční systémové konstrukce.
Nedávná pandemie zdůrazňuje křehkost “just-in-time” plánování dodavatelského řetězce. Stává se stále více zřejmým, že v stále složitějším a nejistějším světě nemůže průmysl již déle dovolit takovou inflexibilitu. V současné době musí výroba učinit pevnou volbu mezi “Low-Mix High-Volume” (LMHV) a “High-Mix Low-Volume” (HMLV). Průmysl 5.0 předpokládá perspektivu “High-Mix High-Volume” (HMHV), ve které lze pracovní postup rekonfigurovat za nízkou cenu, aby splňoval tekoucí požadavky. K tomu je třeba “automatizovat automatizaci”, aby se eliminovala potřeba lidského zásahu a/nebo systémového výpadku, když se změní problém nebo prostředí. To vyžaduje systémy, které “pracují na příkaz”, reagují na takové změny, zatímco stále mají rozumnou perspektivu dokončení svých přidělených úkolů v reálném čase. Zvažte, jako příklad, instruování montážního robota, který je aktuálně zapojen do úkolu X, následovně:
“Zastavte montáž X okamžitě: zde je specifikace Y a zde jsou většina vašich starých a několik nových efektů. Nyní začněte montovat Y, vyhýbejte se takovým a takovým druhům vad a plýtvání.”
Navzdory široké nedávné diskusi o brzkém příchodu “Umělé obecné inteligence” (AGI) prostřednictvím takzvaných velkých jazykových modelů, jako je GPT-3, žádný z navrhovaných přístupů není skutečně schopen “pracovat na příkaz”. To znamená, že nemohou být zadány úkolem, který je zcela mimo jejich trénovací sadu, bez výpadku offline přeškolení, ověření a opětovného nasazení.
Je jistě zřejmé, že jakékoli skutečné pojetí inteligence je neoddělitelně spojeno s reakcí na změnu. Systém, který zůstává nezměněn – bez ohledu na to, kolik neočekávaných událostí je vystaven – není ani autonomní, ani inteligentní. To není míněno jako poškození nepochybných silných stránek takových hlubokých učících (DL) přístupů, které měly velký úspěch jako prostředek syntézy programů pro problémy, které jsou obtížně explicitně specifikovatelné.
Takže jaký druh systémové funkcionality by mohl umožnit AI přesáhnout tento trénink, zmrazení a nasazení paradigmatu, směrem k tomu, který je schopen nepřetržité adaptivní učení? Zvažte potřebu nahradit vadný komponent ve výrobním pracovním postupu komponentem od jiného dodavatele, který by mohl mít jiné tolerance. S koncovým černým boxovým modelováním současného AI musí být proces digitálního dvojčete proveden znovu. Aby se adresovaly omezení současného přístupu, je vyžadována radikální změna: model, který může přímo uvažovat o důsledcích změny komponenty – a skutečně obecnějších kontrafaktických “co kdyby” scénářů. Rozložení pracovního postupu na komponenty s známými vlastnostmi a opětovné spojení jich podle potřeby vyžaduje to, co se nazývá “kompozicionalita”.
Kompozicionalita dosud unikla současnému AI, kde je často zmatena se slabším pojmem modularity. Modularity se zabývá schopností “lepit” komponenty вместе, ale to nezachycuje podstatu kompozicionality, která je schopnost uvažovat o chování výsledného pracovního postupu, aby se určilo a zajistilo zachování některých požadovaných vlastností. Tato schopnost je vitální z důvodů verifikace a bezpečnosti: například schopnost systému uvažovat, že “přijetí motoru od alternativního výrobce zvýší celkovou produkci elektrárny, zatímco všechny její ostatní komponenty zůstanou v teplotních mezích.”
Ačkoli současné přístupy založené na neuronových sítích vynikají v učení pravidel z dat, postrádají kompozicionální uvažování. Jako alternativu k naději, že kompozicionální uvažování vyvstane z neuronových sítí, je možné přímo využít konstrukcí teorie kategorií, matematického studia kompozicionality. Konkrétně jeho subobor kategoriální kybernetika se zabývá bidirekcionálními kontroléry jako základními reprezentačními prvky. Bidirekcionální je schopnost provádět jak přední, tak i inverzní inference: předpověď z příčin na účinky a naopak. Kompozicionální inverzní inference je zvláště důležitá, protože umožňuje začlenění zpětné vazby z prostředí na jakékoli úrovni strukturní reprezentace – to usnadňuje rychlé učení z malého počtu příkladů.
Daný nějaký požadovaný systémový chování, učí se úkolem sestavit agregovanou kontrolní strukturu, která splňuje. Počátečně naučené struktury slouží jako kostra pro následné učení.
Jak se systémové znalosti zvyšují, tato kostra může být vyzdobena naučenými kompozicionálními vlastnostmi, podobně jako molekula H2O může být určena mít různé vlastnosti než její ústavní atomy. Kromě toho, stejně jako “házení míče” a “švihnutí tenisové rakety” lze považovat za související muskuloskeletální akce pro člověka, tak i související úkoly mohou sdílet kostra kontroléru, která je ozdobena způsobem specifickým pro úkol prostřednictvím zpětné vazby z prostředí. Toto oddělení kauzální struktury od úkolových specifik může usnadnit učení nových úkolů bez katastrofického zapomínání, které sužuje současné přístupy. Proto může hybridní numericko-symboický přístup výše uvedeného typu kombinovat silné stránky obou neuronových a symbolických přístupů, tím, že má jak explicitní pojetí struktury, tak i schopnost učit se adaptivně, jak jsou vlastnosti komponovány. Uvažování o kompozicionálních vlastnostech je založeno na probíhající práci, kterou systém právě vykonává.
V závěru je zřejmé, že je vyžadován nový přístup k vytvoření skutečně autonomních systémů: systémů schopných akomodovat významné změny a/nebo operovat v neznámých prostředích. To vyžaduje nepřetržité adaptivní učení a generalizaci z toho, co je již známo. Navzdory jejich názvu mají hluboké učící přístupy pouze povrchní reprezentaci světa, která nemůže být manipulována na vysoké úrovni učícím procesem. Naopak navrhujeme, že AGI systémy, které vzniknou v příští generaci, budou zahrnovat hluboké učení v rámci širší architektury, vybavené schopností uvažovat přímo o tom, co znají.
Schopnost systému uvažovat symbolicky o své vlastní reprezentaci poskytuje významné výhody pro průmysl: s explicitně kompozicionální reprezentací může být systém audován – ať už lidmi nebo vnitřně systémem samotným – aby splňoval vitální požadavky bezpečnosti a spravedlnosti. Zatímco existovalo mnoho akademických obav o takzvané x-risk AGI, správné zaměření je spíše konkrétní inženýrský problém rekonfigurace kontrolního systému, zatímco zachování těchto vitálních požadavků, proces, který nazýváme interaktivní zarovnání. Je pouze prostřednictvím přijetí tohoto druhu kontrolních systémů, které jsou důvěryhodné a efektivní kontinuální učiteli, že budeme moci realizovat příští generaci autonomie, kterou předpokládá Průmysl 5.0.






