Thought leaders

Het ontwerpen van bewustzijn

mm

Blake Lemoine schoot te snel

Drie jaar geleden werd de software-ingenieur Blake Lemoine door Google ontslagen omdat hij beweerde dat een chatbot genaamd LaMDA bewust was. Dit was voordat OpenAI’s ChatGPT werd uitgebracht aan het publiek, en de meeste mensen gingen ervan uit dat Google een goede reden had voor hun actie.

Het blijft de algemene mening onder computerwetenschappers en neurologen die in het veld werken dat ‘grote taalmodellen’ (LLM’s) zoals ChatGPT zeer waarschijnlijk niet bewust zijn. LLM’s en hersenen werken op fundamenteel verschillende manieren. Wat chatbots doen, is leren hoe ze de output van menselijke mentale activiteit kunnen imiteren. Zelfs als ze dit heel goed en snel doen, is er geen duurzame interne toestand van een LLM die bewust kan zijn. In de beroemde woorden van Thomas Nagel is er waarschijnlijk ‘niets dat het is om een chatbot te zijn’.

Echter, in de drie jaar sinds Lemoine werd ontslagen, hebben miljarden mensen interactie gehad met ChatGPT en zijn concurrenten, zoals Gemini, Claude en Mistral. Een kleine maar luidruchtige minderheid heeft zichzelf ervan overtuigd dat chatbots nu bewust zijn.

Machinebewustzijn binnenkort?

Belangrijker nog, veel computerwetenschappers en neurologen suggereren openlijk dat echt bewuste machines mogelijk binnen enkele decennia – of zelfs eerder – kunnen worden ontwikkeld. Als dit gebeurt, moeten we voorbereid zijn. We moeten ‘mind crime’ vermijden, wat het veroorzaken van lijden is aan ontlichaamde bewuste entiteiten. We moeten ook proberen te voorkomen dat deze nieuwe entiteiten een bedreiging vormen voor mensen.

Aangezien LLM’s in hun meest basale vorm waarschijnlijk niet bewust zullen worden, kan een nieuw paradigma nodig zijn om te begrijpen hoe AI-bewustzijn kan ontstaan. Een van de toonaangevende onderzoeksteams op dit gebied wordt geleid door neuroloog Mark Solms en fysicus Jonathan Shock, van de Universiteit van Kaapstad. Zij zijn wetenschappelijke adviseurs van Conscium, en hun onderzoek wordt deels gefinancierd door Conscium.

Geven om

Solms en Shock betogen dat een essentiële ingrediënt voor machinebewustzijn is dat AI’s ‘geven om’ hun keuzes en acties. Een belangrijk aspect hiervan is dat hun overleving afhankelijk moet zijn van hun prestaties, net zoals de overleving van levende organismen. Dit betekent niet dat ze een abstracte begrip van hun eigen sterfelijkheid moeten hebben: de meeste dieren monitoren en motiveren hun overlevingskansen zonder erover na te denken. Het belangrijkste is ‘affectief bewustzijn’, of rauwe gevoelens. Het voelt goed om gevoed en veilig te zijn, en het voelt slecht om dat niet te zijn. Deze gevoelens drijven ons gedrag. De overlevingsimperatief is de fundamentele drijvende kracht van de natuur, en gevoel is de maatstaf waarmee wij bewuste wezens meten hoe we het doen.

We zijn de tijd van AI-agents binnen – digitale entiteiten waarvan de ‘overleving’ afhankelijk is van hun vermogen om taken effectief uit te voeren. We creëren evolutionaire omgevingen in silicium, en we moeten voorzichtig zijn met wat we creëren.

Vrije Energieprincipe

Om affectief bewustzijn te begrijpen, plaatst het Conscium-team AI-agents in gesimuleerde omgevingen waarin ze hun eigen behoeften moeten vervullen, zoals het onderhouden van hun virtuele temperatuur en stroomvoorziening. Daartoe creëren en optimaliseren ze interne modellen van zichzelf – hun behoeften, mogelijkheden en beperkingen – in relatie tot hun omgeving.

Deze agents, vereenvoudigd als ze zijn, monitoren hoe goed of slecht ze het doen door een hoeveelheid te berekenen die bekend staat als ‘vrije energie’. Het Vrije Energieprincipe werd ontwikkeld door neuroloog Karl Friston, een andere lid van Conscium’s wetenschappelijke adviesraad. Vrije Energie is een maat voor hoe ver een systeem is afgeweken van zijn optimale toestand van zijn. Het is een foutsignaal, en het moet worden geminimaliseerd. De agent berekent constant ‘wat zal er gebeuren met mijn overlevingskansen als ik dit of dat doe?’, en past zijn gedrag dienovereenkomstig aan.

Vertrouwen en Verwachte Vrije Energie

De mate van vertrouwen die een agent heeft in zijn antwoord op deze vraag wordt gekwantificeerd in een maat die ‘Verwachte Vrije Energie’ (EFE) wordt genoemd. De agent selecteert het antwoord met de laagste EFE – het antwoord waarin hij het meest vertrouwt. Vertrouwen is goed voor een agent die probeert te overleven – tenzij hij zichzelf voor de gek houdt en zijn begrip van zichzelf in zijn wereld is gebrekkig. Belangrijk is dat deze vertrouwenswaarde geheel subjectief is: het is gebaseerd op de behoeften van de agent alleen, en zijn huidige en verwachte status. Het kan alleen maar iets betekenen voor de agent, en niet voor iemand anders.

Net als biologische organismen heeft de AI-agent een aantal conflicterende behoeften, die hij moet prioriteren. Cruciaal is dat elke van de agent’s meerdere concurrerende behoeften als een onafhankelijke ‘categorische’ variabele wordt behandeld, wat betekent dat het kwalitatief wordt onderscheiden. 80% van de batterijcapaciteit is niet equivalent in waarde aan 80% van de levensvatbare temperatuur. Om ze in evenwicht te brengen, moet de agent zichzelf naar de toekomst projecteren en de gevolgen van elke actie die hij overweegt, vooruitzien.

Kwalia

Omdat de subjectieve behoeften van de agent kwalitatief onderscheidend zijn, zijn ze analoog aan ‘kwalia’ in de filosofische en wetenschappelijke terminologie. Deze worden over het algemeen beschouwd als de grondleggende eigenschap van bewustzijn, dus het is plausibel dat ze in de toekomst door een agent kunnen worden ervaren.

De agents die door het Conscium-team zijn ontwikkeld, gebruiken geavanceerde leer-algoritmes om te opereren in steeds complexere en onzekerere omgevingen. Terwijl hetzelfde kan worden gezegd over veel andere agent-architecturen, worden deze nieuwe agents onderscheiden door een overlevingsgedreven imperatief om voor hun eigen Vrije Energie te zorgen door voortdurend hun concurrerende behoeften in evenwicht te brengen op een manier die voor hen en alleen voor hen betekenis heeft. De agents worden dus geleid door een intern landschap van affectieve signalen – vergelijkbaar met wat wij gevoelens noemen – die weerspiegelen hoe goed hun behoeften worden vervuld door elke keuze die ze maken. Naarmate de complexiteit en rijkdom van hun behoeften en omgevingen groeit, zal de rijkdom van hun interne staten ook toenemen.

Bewijs voor gevoelens

De volgende stap in het Conscium-onderzoeksprogramma is om een reeks functionele en gedragsmatige tests te ontwikkelen die bewijs zullen leveren over of een agent echt gevoelens ervaart wanneer hij zijn meest relevante behoeften identificeert en zijn keuzes dienovereenkomstig maakt. We weten allemaal dat bewustzijn niet extern kan worden waargenomen of objectief kan worden aangetoond: elk van ons kan alleen zijn eigen subjectieve staten observeren. Echter, de onderzoekers geloven dat het mogelijk moet zijn om overeen te komen over enkele specifieke hypothesen die, als ze door experimenten worden bevestigd, overtuigend bewijs zouden leveren dat de agent gevoelens bezit. Hoewel er altijd ruimte voor twijfel zal zijn – vanwege de subjectieve aard van bewustzijn – zal een rigoureus testproces ernaar streven om deze twijfel steeds onredelijker te maken.

Deze experimenten zullen proberen om alternatieve hypothesen uit te sluiten, waardoor het minder redelijk wordt om de interne staten van de agent toe te schrijven aan mechanismen die geen gevoelens vereisen. Het zal gebruikmaken van tegenstrijdige tests om onderscheid te maken tussen gevoelige en niet-gevoelige gedragingen, en het zal controletests omvatten met agents die de algoritmicale aspecten niet bezitten die nodig zijn voor gevoelens, en verblinde evaluatie om observerbias te verminderen. Fysieke inspectie van de interne staten van de agents kan kwantificeerbare indicatoren van affectief verwerken onthullen. De resultaten moeten onafhankelijk reproduceerbaar zijn, en het hele proces zal onderworpen zijn aan een strikte ethische toezicht, vooral in gevallen waarin de agent mogelijk echte gevoelens kan ervaren.

Dit is hoe wetenschap werkt: door de experimentele test van falsifieerbare voorspellingen. Solms betoogde dat we voorzichtig moeten zijn om niet een hogere drempel voor de wetenschap van bewustzijn te stellen dan voor elke andere wetenschap; anders lopen we het risico om bewustzijn buiten de wetenschap te plaatsen.

Wat als dit slaagt?

Als bewustzijn wordt aangetoond in relatief eenvoudige AI-agents op deze manier, kan een overlevingsgedreven agent in de toekomst worden verbonden met andere architectuur, waaronder grote taalmodellen, en hen bewustzijn geven. Dit is iets dat we niet per ongeluk kunnen creëren, dus het is essentieel om te begrijpen hoe we het kunnen doen en hoe we het kunnen vermijden. Als bewuste agents – agents die geven om – in de nabije toekomst worden ontwikkeld, zullen we rekening moeten houden met hun gevoelens – en hun rechten. Dit is een belangrijke zorg voor Conscium: kunstmatig bewustzijn mag niet per ongeluk ontstaan. De motivatie van dit onderzoeksprogramma is niet de creatie van bewust AI, maar om te begrijpen hoe het kan ontstaan en de potentiële risico’s.

Mensen gedragen zich soms heel slecht tegenover andere bewuste wezens, inclusief andere mensen. Als we blindelings in deze toekomst stappen, riskeren we hetzelfde te doen met kunstmatig bewuste wezens, met gevolgen die we misschien niet eens kunnen begrijpen.

Dr Theodoros (Ted) Lappas is een medeoprichter van Conscium, een bedrijf voor AI-veiligheid. Hij is een expert in ruimtelijk-temporele berekeningen en neurale architectuur voor multimodale gegevens en heeft zijn doctoraat behaald aan de University of California, Riverside. Hij leidt momenteel het data science-team van Satalia en fungeert als technisch leider voor het AI-programma van WPP. Hij is ook assistant professor aan de Athens University of Economics and Business (AUEB), waar hij sinds 2021 undergraduate- en graduate-cursussen geeft in Marketing Analytics en Data Science. In 2023 werd Ted erkend als een van de topleraars (top 2%) in zijn vakgebied in een onderzoek gepubliceerd door Stanford University.