Thought leaders
Waarom Industry 5.0 Artificial General Intelligence nodig heeft

Door: Bas Steunebrink, medeoprichter en directeur van Artificial General Intelligence, Eric Nivel, Lead AGI Engineer & Jerry Swan, Research Scientist at NNAISENSE.
We nemen automatisering in onze moderne wereld voor lief, en profiteren elke dag van supply chains die de hele wereld omvatten en een enorme selectie aan goederen op onze planken leveren. Maar achter de schermen genereren de productie en het transport van goederen veel optimalisatie-uitdagingen, zoals verpakking, planning, routing en automatisering van productielijnen. Deze optimalisatie-uitdagingen zijn dynamisch en veranderen constant in tandem met de werkelijke wereld. Bijvoorbeeld, verwachte supply routes kunnen plotseling worden onderbroken vanwege onvoorziene omstandigheden – bijvoorbeeld, het Suezkanaal kan worden geblokkeerd; luchtroutes kunnen veranderen vanwege vulkaanuitbarstingen; hele landen kunnen onbereikbaar zijn vanwege conflict. Veranderingen in wetgeving, valuta-inzinkingen en schaarse middelen zijn ook voorbeelden van supply-side variabelen die constant in beweging zijn.
Om een ander voorbeeld te geven, moet soms een nieuw onderdeel worden geïntegreerd in een machine of workflow (gebruikers kunnen bijvoorbeeld andere materialen of kleuren willen). Momenteel is er expert human labour nodig om wijzigingen aan te brengen in het systeem, of – in het geval van machine learning – om het systeem opnieuw te trainen en opnieuw in te zetten. Op een soortgelijke manier zijn de “digitale tweelingen” van Industry 4.0 nog steeds zwaar afhankelijk van de notie dat de probleembeschrijving en de verdeling van invoer eenmalig kan worden gespecificeerd bij het ontwerp van het systeem.
De recente pandemie benadrukt de kwetsbaarheid van “just-in-time” supply chain planning. Het wordt steeds duidelijker dat de industrie in een steeds complexere en onzekerdere wereld geen dergelijke inflexibiliteit meer kan betalen. Op dit moment moet de productie een vaste keuze maken tussen “Low-Mix High-Volume” (LMHV) en “High-Mix Low-Volume” (HMLV). Industry 5.0 voorziet de mogelijkheid van “High-Mix High-Volume” (HMHV), waarbij de workflow tegen lage kosten kan worden herconfigureerd om aan vloeibare eisen te voldoen. Om dit te bereiken, is het nodig om “automatisering van automatisering” te realiseren, om de noodzaak voor menselijke interventie en/of systeem downtime te elimineren wanneer het probleem of de omgeving verandert. Dit vereist systemen die “op commando werken”, die reageren op dergelijke veranderingen, terwijl ze nog steeds een redelijke kans hebben om hun toegewezen taken binnen de tijdslimiet van de werkelijke wereld te voltooien. Overweeg bijvoorbeeld het geven van instructies aan een assemblagelijnrobot, die momenteel bezig is met taak X, als volgt:
“Stop onmiddellijk met het assembleren van X: hier is een specificatie van Y, en hier zijn de meeste van uw oude en een paar nieuwe effectoren. Begin nu met het assembleren van Y, terwijl u dergelijke en dergelijke soorten defecten en verspilling vermijdt.”
Ondanks de wijdverbreide recente discussie over de aanstaande komst van “Artificial General Intelligence” (AGI) via zogenaamde Large Language Models zoals GPT-3, is geen van de voorgestelde benaderingen echt in staat om “op commando te werken”. Dat wil zeggen, ze kunnen niet worden belast met iets dat volledig buiten hun trainingsset valt zonder de downtime van offline herbetraining, verificatie en opnieuw inzetten.
Het is zeker duidelijk dat elk realistisch begrip van intelligentie onlosmakelijk verbonden is met responsiviteit voor verandering. Een systeem dat onveranderd blijft – ongeacht hoeveel onverwachte gebeurtenissen het wordt blootgesteld – is noch autonoom noch intelligent. Dit is niet om de onbetwiste sterke punten van dergelijke diepe leerbenaderingen (DL) te bagatelliseren, die groot succes hebben geboekt als middel om programma’s te synthetiseren voor problemen die moeilijk expliciet te specificeren zijn.
Wat voor soort systeemfunctionaliteit zou in staat zijn om AI te laten evolueren van een train, freeze en deploy-paradigma naar een dat in staat is om ononderbroken adaptief te leren? Overweeg de noodzaak om een defect onderdeel in een productieworkflow te vervangen door een onderdeel van een andere leverancier, dat mogelijk andere toleranties heeft. Met de eind-tot-eind black box-modellering van hedendaagse AI moet het digitale tweelingproces opnieuw worden gedaan. Om de beperkingen van hedendaagse benaderingen aan te pakken, is een radicale verandering vereist: een model dat direct kan redeneren over de gevolgen van een onderdeelwijziging – en inderdaad meer algemene contrafactualiteit “wat als” scenario’s. Het decomponeren van een workflow in componenten met bekende eigenschappen en het opnieuw combineren ervan als nodig is, vereist wat bekend staat als “compositionality”.
Compositionality is tot nu toe aan hedendaagse AI ontsnapt, waar het vaak wordt verward met het zwakkere begrip modularity. Modularity houdt zich bezig met de mogelijkheid om componenten “te lijmen”, maar dit faalt om de essentie van compositionality te vangen, die de mogelijkheid is om te redeneren over het gedrag van de resulterende workflow om de bewaring van een gewenste eigenschap te bepalen en te waarborgen. Deze mogelijkheid is essentieel voor redenen van verificatie en veiligheid: bijvoorbeeld, de mogelijkheid van het systeem om te redeneren dat “het aannemen van een motor van een alternatieve fabrikant de totale stroomuitvoer van de installatie zal verhogen, terwijl alle andere componenten binnen de temperatuurgrenzen blijven”.
Hoewel hedendaagse neurale netwerkbenaderingen uitstekend zijn in het leren van regels uit data, ontbreekt het hen aan compositioneel redeneren. Als alternatief voor de hoop dat compositioneel redeneren zal ontstaan uit neurale netwerkarchitecturen, is het mogelijk om direct gebruik te maken van de constructies van categorietheorie, de wiskundige studie van compositionality. In het bijzonder is de subdiscipline categorische cybernetica bezig met bidirectionele controllers als fundamentele representatie-elementen. Bidirectionality is de mogelijkheid om zowel voorwaartse als inverse inferentie uit te voeren: voorspellingen maken van oorzaken tot effecten en vice versa. Compositionele inverse inferentie is vooral belangrijk omdat het de incorporatie van feedback van de omgeving mogelijk maakt op elk schaalniveau van structuurrepresentatie – dit faciliteert snel leren van een klein aantal voorbeelden.
Gegeven een gewenst systeemgedrag, is de leertaak om een geaggregeerde controlestructuur te bouwen die hieraan voldoet. Aanvankelijk geleerde structuren fungeren als een skelet voor latere lering.
Naarmate het systeemkennis toeneemt, kan dit skelet worden versierd met geleerde compositionele eigenschappen, vergelijkbaar met hoe een H2O-molecuul kan worden bepaald om andere eigenschappen te hebben dan die van zijn constituerende atomen. Bovendien, net zoals “een bal gooien” en “een tennisracket zwaaien” kunnen worden gezien als verwante musculoskeletale acties voor een mens, kunnen verwante taken een skeletachtige controllerstructuur delen die wordt versierd op een taak-specifieke manier via feedback van de omgeving. Deze ontkoppeling van causale structuur van taak-specifieke aspecten kan het leren van nieuwe taken faciliteren zonder de catastrofale vergetelheid die hedendaagse benaderingen teistert. Daarom kan een hybride numeriek-symbolische benadering van de bovengenoemde vorm de sterke punten van zowel neurale als symbolische benaderingen combineren, door zowel een expliciete notie van structuur als de mogelijkheid te hebben om adaptief te leren hoe eigenschappen worden samengesteld. Redeneren over compositionele eigenschappen is gebaseerd op een voortdurende basis door het werk dat het systeem momenteel wordt opgedragen uit te voeren.
In conclusie, is het duidelijk dat een nieuwe benadering vereist is om echt autonome systemen te creëren: systemen die in staat zijn om significante veranderingen te accommoderen en/of te opereren in onbekende omgevingen. Dit vereist ononderbroken adaptief leren en generaliseren van wat al bekend is. Ondanks hun naam hebben diepe leerbenaderingen alleen een oppervlakkige representatie van de wereld die niet op een hoog niveau kan worden gemanipuleerd door het leerproces. In tegenstelling tot wat wij voorstellen dat de AGI-systemen die in de volgende generatie ontstaan, diepe leren binnen een bredere architectuur integreren, uitgerust met de mogelijkheid om direct te redeneren over wat ze weten.
De mogelijkheid voor een systeem om symbolisch te redeneren over zijn eigen representatie verleent significante voordelen voor de industrie: met een expliciet compositionele representatie kan het systeem worden gecontroleerd – ofwel door mensen of intern door het systeem zelf – om vitale eisen van veiligheid en eerlijkheid te vervullen. Terwijl er veel academische zorg is over het zogenaamde x-risk van AGI, is de juiste focus eerder het concrete ingenieursprobleem van het opnieuw inzetten van een controle systeem terwijl deze vitale eisen behoudt, een proces dat wij interactive alignment noemen. Het is alleen door de adoptie van dit soort controle systemen, die betrouwbaar en efficiënt zijn in hun continue leren, dat we de volgende generatie van autonomie zoals voorzien door Industry 5.0 kunnen realiseren.






