výhonek Proč Průmysl 5.0 potřebuje umělou obecnou inteligenci – Unite.AI
Spojte se s námi

Myšlenkové vůdce

Proč Průmysl 5.0 potřebuje umělou obecnou inteligenci

mm
aktualizováno on

Autor: Bas Steunebrink, spoluzakladatel a ředitel umělé obecné inteligence, Eric Nivel, hlavní inženýr AGI & Jerry Swan, vědecký pracovník ve společnosti NNAISENSE.

V našem moderním světě považujeme automatizaci za samozřejmost, každý den těžíme z dodavatelských řetězců, které pokrývají celou zeměkouli a dodávají do našich regálů obrovský výběr zboží. V zákulisí však výroba a pohyb zboží generuje mnoho optimalizačních výzev, jako je balení, plánování, směrování a automatizace montážní linky. Tyto optimalizační výzvy jsou dynamické a neustále se mění v tandemu s reálným světem. Například očekávané zásobovací trasy mohou být náhle ohroženy kvůli nepředvídaným okolnostem – například může být zablokován Suezský průplav; vzdušné trasy se mohou změnit v důsledku sopečných erupcí; celé země mohou být kvůli konfliktu nepřístupné. Změny v legislativě, kolaps měny a vzácné zdroje jsou také příklady proměnných na straně nabídky, které se neustále mění.

Abychom uvedli další příklad, někdy musí být do stroje nebo pracovního postupu začleněna nová součást (uživatelé mohou například chtít různé materiály nebo barvy). V současné době je k provádění změn v systému nebo – v případě strojového učení – k dodatečnému přeškolení a opětovnému nasazení řešení vyžadována odborná lidská práce. Podobným způsobem jsou „digitální dvojčata“ Průmyslu 4.0 stále silně závislá na představě, že popis problému a distribuci vstupů lze jednou provždy specifikovat v okamžiku počátečního návrhu systému.

Nedávná pandemie zdůrazňuje křehkost plánování dodavatelského řetězce „just-in-time“. Stále více se ukazuje, že ve stále složitějším a nejistějším světě si průmysl již nemůže dovolit takovou nepružnost. V současné době musí výroba učinit pevnou volbu mezi „Low-Mix High-Volume“ (LMHV) a „High-Mix Low-Volume“ (HMLV). Průmysl 5.0 počítá s vyhlídkou „High-Mix High-Volume“ (HMHV), ve které lze pracovní tok s nízkými náklady překonfigurovat tak, aby vyhovoval požadavkům na tekutiny. K dosažení tohoto cíle je zapotřebí „automatizace“, aby se eliminovala potřeba lidského zásahu a/nebo prostoje systému, když se problém nebo prostředí změní. To vyžaduje systémy, které „pracují na povel“ a reagují na takové změny, a přitom mají stále rozumnou vyhlídku na dokončení přidělených úkolů v rámci reálného času. Vezměme si jako příklad následující instrukce pro robota na montážní lince, který je právě zapojen do úkolu X:

"Okamžitě přestaňte sestavovat X: zde je specifikace Y a zde je většina vašich starých a několik nových efektorů." Nyní začněte sestavovat Y a vyhněte se takovým a takovým druhům defektů a plýtvání."

Navzdory rozšířeným nedávným řečem o brzkém příchodu „Umělé obecné inteligence“ (AGI) prostřednictvím takzvaných velkých jazykových modelů, jako je GPT-3, žádný z navrhovaných přístupů není skutečně schopen „práce na příkaz“. To znamená, že nemohou být pověřeni něčím zcela mimo jejich tréninkovou sadu bez prostojů v podobě offline přeškolování, ověřování a přesazování.

Je jistě jasné, že jakákoli představa o inteligenci v reálném světě je neoddělitelně spojena s citlivostí na změny. Systém, který zůstává nezměněn – bez ohledu na to, kolika neočekávaným událostem je vystaven – není ani autonomní, ani inteligentní. To však nesnižuje nepochybnou sílu těchto přístupů hlubokého učení (DL), které se těšily velkému úspěchu jako prostředek syntézy programů pro problémy, které je obtížné explicitně specifikovat.

Jaký druh funkčnosti systému by tedy mohl umožnit umělé inteligenci posunout se za hranice tohoto vlaku, zmrazit a nasadit paradigma směrem k takovému, které je schopné nepřerušovaného adaptivního učení? Zvažte potřebu vyměnit vadnou součást ve výrobním pracovním postupu za součást od jiného dodavatele, která může mít různé tolerance. Díky komplexnímu modelování černé skříňky současné umělé inteligence musí být proces digitálního twinningu proveden znovu. Abychom se vypořádali s omezeními současných přístupů, je zapotřebí radikální změna: model, který může přímo uvažovat o důsledcích změny komponenty – a skutečně obecnější kontrafaktuální scénáře „co kdyby“. Rozložení pracovního postupu na komponenty se známými vlastnostmi a jejich rekombinace podle potřeby vyžaduje to, co je známé jako „kompozičnost“.

Kompozičnost se současné umělé inteligenci zatím vyhýbá, kde je často zaměňována se slabším pojmem modularity. Modularita se týká schopnosti 'lepit' komponenty dohromady, ale to nevystihuje podstatu kompozičnosti, což je schopnost uvažovat o chování výsledného pracovního postupu s cílem určit a zajistit zachování nějaké požadované vlastnosti. Tato schopnost je životně důležitá z důvodů ověřování a bezpečnosti: například schopnost systému uvažovat, že „přijetí motoru od alternativního výrobce zvýší celkový výkon elektrárny, zatímco všechny jeho ostatní součásti zůstanou v teplotních mezích“.

Přestože současné přístupy neuronových sítí vynikají v učení pravidel z dat, postrádají kompoziční uvažování. Jako alternativu k naději, že kompoziční uvažování se vynoří z architektur neuronových sítí, je možné přímo použít konstrukce teorie kategorií, matematické studium kompozice. Zejména její podobor kategoriální kybernetika se zabývá obousměrnými regulátory jako základními reprezentačními prvky. Obousměrnost je schopnost provádět dopřednou i inverzní inferenci: předpovídání od příčin k následkům a naopak. Kompoziční inverzní inference je zvláště důležitá, protože umožňuje začlenění zpětné vazby z prostředí v jakémkoli měřítku strukturální reprezentace – to usnadňuje rychlé učení z malého počtu příkladů.

Vzhledem k určitému požadovanému chování systému je potom úkolem učení vytvořit agregovanou řídicí strukturu, která to splňuje. Původně naučené struktury fungují jako kostra pro následné učení.

Jak se znalosti systému rozšiřují, může být tato kostra zdobena naučenými kompozičními vlastnostmi, podobně jako lze určit, že molekula H2O má jiné vlastnosti, než jaké mají její jednotlivé atomy. Kromě toho, stejně jako „házení míčem“ a „houpání tenisovou raketou“ mohou být považovány za související muskuloskeletální činnosti pro člověka, mohou související úkoly sdílet strukturu kosterního ovladače, která je ozdobena způsobem specifickým pro daný úkol prostřednictvím zpětné vazby od životní prostředí. Toto oddělení kauzální struktury od specifických úkolů může usnadnit učení se novým úkolům bez katastrofického zapomínání, které sužuje současné přístupy. Hybridní numericko-symbolický přístup výše popsané formy tedy může kombinovat silné stránky neurálního i symbolického přístupu tím, že má jak explicitní představu o struktuře, tak schopnost adaptivně se učit, jak jsou vlastnosti složeny. Úvahy o kompozičních vlastnostech jsou průběžně založeny na práci, kterou je systém aktuálně přikázán vykonávat.

Závěrem je zřejmé, že k vytvoření skutečně autonomních systémů je zapotřebí nový přístup: systémy schopné přizpůsobit se významným změnám a/nebo fungovat v neznámém prostředí. To vyžaduje nepřerušované adaptivní učení a zobecňování toho, co je již známo. Navzdory svému názvu mají přístupy hlubokého učení pouze povrchní reprezentaci světa, kterou nelze procesem učení na vysoké úrovni manipulovat. Na rozdíl od toho navrhujeme, aby systémy AGI vznikající v příští generaci začlenily hluboké učení v rámci širší architektury vybavené schopností přímo uvažovat o tom, co ví.

Schopnost systému symbolicky uvažovat o své vlastní reprezentaci přináší významné výhody pro průmysl: s explicitně kompoziční reprezentací může být systém kontrolován – ať už lidmi nebo interně systémem samotným – aby splňoval zásadní požadavky na bezpečnost a spravedlnost. Zatímco tam byl velký akademický zájem o tak-zvané x-riziko z AGI, vhodné zaměření je spíše na konkrétní inženýrský problém opětovného zadání řídicího systému při zachování těchto životně důležitých požadavků, což je proces, který nazýváme interaktivním zarovnáním. Jedině přijetím tohoto druhu řídicích systémů, které jsou důvěryhodnými a účinnými průběžnými studenty, budeme schopni realizovat další generaci autonomie, kterou si představuje Průmysl 5.0.

Od raného věku se Bas ptal, jak inteligence umožňuje, aby člověk podával kompetentní výkony navzdory nevyhnutelně nedostatečným zdrojům. Aby lépe porozuměl přirozené racionalitě, jeho výzkum se zpočátku zaměřil na umělé emoce, než přešel na křemíkové přístupy k obecné inteligenci jako postdoktorand IDSIA, kde získal několik ocenění za nejlepší papír a grant od Future of Life Institute. Na NNAISENSEBas vede úsilí o vývoj univerzální umělé inteligence.