stomp Een stille evolutie in AI: de opkomst van samengestelde AI-systemen die verder gaan dan traditionele AI-modellen - Unite.AI
Verbind je met ons

Artificial Intelligence

Een stille evolutie in AI: de opkomst van samengestelde AI-systemen die verder gaan dan traditionele AI-modellen

mm
Bijgewerkt on

Terwijl we door de recente ontwikkelingen op het gebied van kunstmatige intelligentie (AI) navigeren, is er een subtiele maar belangrijke transitie gaande, waarbij we niet meer afhankelijk zijn van op zichzelf staande AI-modellen zoals grote taalmodellen (LLM's) naar meer genuanceerd en collaboratief samengestelde AI-systemen als AlphaGeometrie en Ophalen van Augmented Generation (RAG) systeem. Deze evolutie is in 2023 in een stroomversnelling gekomen en weerspiegelt een paradigmaverschuiving in de manier waarop AI met diverse scenario's kan omgaan, niet alleen door het opschalen van modellen, maar ook door de strategische assemblage van systemen met meerdere componenten. Deze aanpak maakt gebruik van de gecombineerde krachten van verschillende AI-technologieën om complexe problemen efficiënter en effectiever aan te pakken. In dit artikel onderzoeken we de samengestelde AI-systemen, hun voordelen en uitdagingen bij het ontwerpen van dergelijke systemen.

Wat is Compound AI-systeem (CAS)?

Compound AI System (CAS) is een systeem dat verschillende componenten integreert, inclusief maar niet beperkt tot AI-modellen, retrievers, databases en externe tools om AI-taken effectief aan te pakken. In tegenstelling tot oudere AI-systemen die slechts één AI-model gebruiken, zoals de op Transformer gebaseerde LLM, legt CAS de nadruk op de integratie van meerdere tools. Voorbeelden van CAS zijn onder meer AlphaGeometry, waarbij een LLM wordt gecombineerd met een traditionele symbolische oplosser om Olympiade-problemen aan te pakken, en een RAG-systeem waarbij een LLM wordt gecombineerd met een retriever en een database voor het beantwoorden van vragen met betrekking tot bepaalde documenten. Hier is het belangrijk om het onderscheid tussen te begrijpen multimodale AI en CAS. Terwijl multimodale AI zich richt op het verwerken en integreren van gegevens uit verschillende modaliteiten (tekst, afbeeldingen, audio) om weloverwogen voorspellingen of reacties te doen, zoals Gemini model integreert CAS meerdere interactieve componenten zoals taalmodellen en zoekmachines om de prestaties en het aanpassingsvermogen bij AI-taken te verbeteren.

Voordelen van CAS

CAS biedt veel voordelen ten opzichte van traditionele, op één model gebaseerde AI. Enkele van deze voordelen zijn als volgt:

  • Verbeterde prestatie: CAS combineert meerdere componenten, elk gespecialiseerd in een bepaalde taak. Door gebruik te maken van de sterke punten van individuele componenten, bereiken deze systemen betere algehele prestaties. Het combineren van een taalmodel met een symbolische oplosser kan bijvoorbeeld leiden tot nauwkeurigere resultaten bij programmeer- en logische redeneringstaken.
  • Flexibiliteit en aanpassingsvermogen: Samengestelde systemen kunnen zich aanpassen aan diverse inputs en taken. Ontwikkelaars kunnen afzonderlijke componenten verwisselen of verbeteren zonder het hele systeem opnieuw te ontwerpen. Deze flexibiliteit maakt snelle aanpassingen en verbeteringen mogelijk.
  • Robuustheid en veerkracht: Diverse componenten zorgen voor redundantie en robuustheid. Als één component faalt, kunnen andere componenten dit compenseren, waardoor de systeemstabiliteit wordt gegarandeerd. Een chatbot die gebruik maakt van Retrieval-Augmented Generation (RAG) kan bijvoorbeeld op een elegante manier omgaan met ontbrekende informatie.
  • Interpreteerbaar en verklaarbaar: Door meerdere componenten te gebruiken, kunnen we interpreteren hoe elke component bijdraagt ​​aan de uiteindelijke output, waardoor deze systemen interpreteerbaar en transparant worden. Deze transparantie is cruciaal voor debuggen en vertrouwen.
  • Specialisatie en efficiëntie: CAS gebruikt meerdere componenten die gespecialiseerd zijn in specifieke AI-taken. Een CAS die is ontworpen voor medische diagnostiek kan bijvoorbeeld een component bevatten die uitblinkt in het analyseren van medische beelden, zoals MRI- of CT-scans, naast een andere component die gespecialiseerd is in natuurlijke taalverwerking om de geschiedenis en aantekeningen van patiënten te interpreteren. Dankzij deze specialisatie kan elk onderdeel van het systeem efficiënt functioneren binnen zijn domein, waardoor de algehele effectiviteit en nauwkeurigheid van de diagnostiek wordt vergroot.
  • Creatieve synergie: Het combineren van verschillende componenten ontketent creativiteit, wat leidt tot innovatieve mogelijkheden. Een systeem dat tekstgeneratie, visuele creatie en muziekcompositie combineert, kan bijvoorbeeld samenhangende multimediaverhalen produceren. Deze integratie stelt het systeem in staat complexe, multi-sensorische inhoud te creëren die met geïsoleerde componenten moeilijk te realiseren zou zijn, wat laat zien hoe de synergie tussen diverse AI-technologieën nieuwe vormen van creatieve expressie kan bevorderen.

CAS bouwen: strategieën en methoden

Om de voordelen van CAS te benutten, onderzoeken ontwikkelaars en onderzoekers verschillende methodologieën voor de constructie ervan. Hieronder worden de twee belangrijkste benaderingen genoemd:

  • Neuro-symbolische benadering: Deze strategie combineert de sterke punten van neurale netwerken in patroonherkenning en leren met de logische redenering en gestructureerde kennisverwerkingsmogelijkheden van symbolische AI. Het doel is om de intuïtieve gegevensverwerkingsmogelijkheden van neurale netwerken te combineren met de gestructureerde, logische redenering van symbolische AI. Deze combinatie heeft tot doel de mogelijkheden van AI op het gebied van leren, redeneren en aanpassen te vergroten. Een voorbeeld van deze aanpak is AlphaGeometry van Google, dat neurale grote taalmodellen gebruikt om geometrische patronen te voorspellen, terwijl symbolische AI-componenten de logica en het genereren van bewijzen verzorgen. Deze methode heeft tot doel AI-systemen te creëren die zowel efficiënt zijn als verklaarbare oplossingen kunnen bieden.
  • Taalmodelprogrammering: Deze aanpak omvat het gebruik van raamwerken die zijn ontworpen om grote taalmodellen te integreren met andere AI-modellen, API's en gegevensbronnen. Dergelijke raamwerken maken de naadloze combinatie mogelijk van oproepen naar AI-modellen met verschillende componenten, waardoor de ontwikkeling van complexe applicaties mogelijk wordt. Met behulp van bibliotheken zoals LangChain en LamaIndex, samen met agentframeworks zoals AutoGPT en BabyAGIondersteunt deze strategie de creatie van geavanceerde applicaties, waaronder RAG-systemen en conversatieagenten zoals WikiChat. Deze aanpak richt zich op het benutten van de uitgebreide mogelijkheden van taalmodellen om AI-toepassingen te verrijken en te diversifiëren.

Uitdagingen bij CAS-ontwikkeling

Het ontwikkelen van CAS introduceert een reeks belangrijke uitdagingen die zowel ontwikkelaars als onderzoekers moeten aanpakken. Het proces omvat het integreren van diverse componenten, zoals de constructie van een RAG-systeem waarbij een retriever, een vectordatabase en een taalmodel worden gecombineerd. De beschikbaarheid van verschillende opties voor elke component maakt het ontwerpen van een samengesteld AI-systeem tot een uitdagende taak, die een zorgvuldige analyse van mogelijke combinaties vereist. Deze situatie wordt verder gecompliceerd door de noodzaak om middelen zoals tijd en geld zorgvuldig te beheren om ervoor te zorgen dat het ontwikkelingsproces zo efficiënt mogelijk is.

Zodra het ontwerp van een samengesteld AI-systeem is vastgesteld, ondergaat het doorgaans een fase van verfijning die gericht is op het verbeteren van de algehele prestaties. Deze fase omvat het verfijnen van de wisselwerking tussen de verschillende componenten om de effectiviteit van het systeem te maximaliseren. Als we het voorbeeld van een RAG-systeem nemen, kan dit proces gepaard gaan met het aanpassen van de manier waarop de retriever, de vectordatabase en de LLM's samenwerken om het ophalen en genereren van informatie te verbeteren. In tegenstelling tot het optimaliseren van individuele modellen, wat relatief eenvoudig is, brengt het optimaliseren van een systeem als RAG extra uitdagingen met zich mee. Dit geldt met name wanneer het systeem onderdelen bevat zoals zoekmachines, die minder flexibel zijn qua aanpassingen. Deze beperking introduceert een extra complexiteitslaag in het optimalisatieproces, waardoor het ingewikkelder wordt dan het optimaliseren van systemen die uit één component bestaan.

The Bottom Line

De transitie naar Compound AI Systems (CAS) betekent een verfijnde aanpak in de AI-ontwikkeling, waarbij de focus verschuift van het verbeteren van op zichzelf staande modellen naar het vervaardigen van systemen die meerdere AI-technologieën integreren. Deze evolutie, benadrukt door innovaties als AlphaGeometry en Retrieval Augmented Generation (RAG), markeert een progressieve stap in het veelzijdiger en robuuster maken van AI, en in staat om complexe problemen met een genuanceerd begrip aan te pakken. Door het synergetische potentieel van diverse AI-componenten te benutten, verlegt CAS niet alleen de grenzen van wat AI kan bereiken, maar introduceert het ook een raamwerk voor toekomstige ontwikkelingen waarbij samenwerking tussen AI-technologieën de weg vrijmaakt voor slimmere, meer adaptieve oplossingen.

Dr. Tehseen Zia is een vaste universitair hoofddocent aan de COMSATS Universiteit Islamabad en heeft een doctoraat in AI behaald aan de Technische Universiteit van Wenen, Oostenrijk. Hij is gespecialiseerd in kunstmatige intelligentie, machinaal leren, datawetenschap en computervisie en heeft belangrijke bijdragen geleverd met publicaties in gerenommeerde wetenschappelijke tijdschriften. Dr. Tehseen heeft ook diverse industriële projecten geleid als hoofdonderzoeker en als AI-consultant.