Connect with us

Thought leaders

Waarom Generative-Augmenteerd Opvragen de Volgende Frontier is van Data-Analyse

mm

Drie van de vier mensen zeggen dat hun organisaties AI gebruiken. Toch concentreert de meeste activiteit zich nog steeds op ongestructureerde inhoud: samenvatten van vergaderingen, opstellen van e-mails of automatiseren van klantenservice.

Maar ironisch genoeg blijft zo veel van de data die daadwerkelijk bedrijfsbeslissingen aandrijft – financiële rapporten, magazijntabellen en KPI’s – grotendeels onaangetast door AI.

De reden is niet een gebrek aan ambitie, maar een gebrek aan vertrouwen. Wanneer een model een zin hallucineert, kan dat vaak worden gefixeerd; wanneer het een nummer hallucineert, is het catastrofaal. Een CFO kan niet goedkeuren wat hij niet kan verifiëren.

Vandaag de dag leeft gestructureerde data over tientallen systemen, elk met zijn eigen regels en relaties. Het krijgen van AI om correct te redeneren over die complexiteit is een moeilijkere uitdaging dan elke chatbot.

Bedrijven en hun teams – inclusief niet-technische gebruikers – moeten in staat zijn om op een eenvoudige manier met hun data te communiceren om knelpunten te verminderen en snelle, nauwkeurige inzichten te verkrijgen. Zonder SQL te hoeven leren.

Enkele oplossingen zijn aan het ontstaan – laten we een aantal prominente voorbeelden bekijken, met hun voordelen en hun tegenslagen.

AI en gestructureerde data – een brug te ver

In de afgelopen twee jaar zijn verschillende inspanningen gedaan om AI-inzichten en gestructureerde data te verbinden.

Veel daarvan komen van technologiebedrijven met aanzienlijke middelen en data. Snowflake, bijvoorbeeld, introduceerde een Cortex Analyst, die gebruikers in staat stelt om natuurlijke taalvragen te stellen tegen Snowflake-datawarehouse.

Om de nauwkeurigheid te verbeteren, heeft Cortex een manier om semantische metagegevens te bieden – maar het model is zwaar beperkt. Ten eerste moet het handmatig worden gebouwd, en zelfs dan kan het alleen werken met maximaal 10 tabellen, nergens genoeg voor een middelgroot bedrijf. Als het hoger is, breekt het vertrouwen, omdat de nauwkeurigheid daalt.

Het verhaal herhaalt zich met pogingen van Databricks, die een text-to-SQL-benadering nam met AI/BI Genie. Deze oplossing kan alleen effectief worden geïmplementeerd op kleine domeinen, waarbij de nauwkeurigheid afneemt met toename van datasets.

Microsoft Power BI Copilot neemt een oppervlakkige generatieve benadering, waarbij AI rechtstreeks in dashboards wordt ingebed om visuals te beschrijven, maatregelen voor te stellen en rapporten op te stellen. Het verbetert de exploratie, maar verandert niet hoe analytics worden geredeneerd of geverifieerd. Elk antwoord is nog steeds afhankelijk van het oordeel van het model, en wanneer dat oordeel faalt, is er geen audittrail of deterministische logica om terug te vallen.

Rob Giardina is mede-oprichter en CEO van Claritype, een bedrijf dat AI-systemen ontwikkelt die verklarende en controleerbare mogelijkheden bieden voor data-analyse in het bedrijfsleven. Hij was eerder werkzaam als Forward Deployed Engineer bij Palantir Technologies.