stomp Sarah Nagy, oprichter en CEO van Seek AI - Interviewreeks - Unite.AI
Verbind je met ons

Interviews

Sarah Nagy, oprichter en CEO van Seek AI - Interviewreeks

mm

gepubliceerd

 on

Sarah Nagy is de oprichter en CEO van Zoek AI, een platform waarmee zakelijke eindgebruikers exact dezelfde vragen aan Seek kunnen stellen die ze momenteel aan het datateam stellen, rechtstreeks in Slack, Teams en e-mail. Geen "verfijning" van hoe ze hun vraag schrijven, en geen nieuw platform leren.

Je begon aanvankelijk als onderzoeker met data van de Hubble Space Telescope. Waar was je mee bezig?

Ik deed onderzoek aan de UCLA en Caltech, keek naar enkele van de verste sterrenstelsels die met een telescoop konden worden waargenomen, en werkte aan het analyseren van enkele van hun eigenschappen, zoals hun massa en grootte. Het doel van dit onderzoek was om ons te helpen het verschil te begrijpen tussen zeer verre sterrenstelsels versus sterrenstelsels die dichter bij de onze staan, en om modellen te ontwikkelen voor hoe deze sterrenstelsels zich in de loop van de tijd vormen.

Daarna werkte je als data scientist bij verschillende startups. Wat waren enkele van de interessantere projecten?

Eén project dat opvalt, betreft het gebruik van natuurlijke taalverwerking (NLP) om ongestructureerde tekst met betrekking tot winkelartikelen te classificeren. Neem bijvoorbeeld onbewerkte tekst (bijvoorbeeld 'air jordans groen') en labeling als het geschatte merk ('Nike'). Ik had een collega die zich specialiseerde in NLP en die bezig was met een ander project, dus het was eigenlijk niet de bedoeling dat ik hieraan zou werken. Het werd uiteindelijk aan mij overhandigd omdat ze het druk hadden. Ik wist toen nog niet eens iets over NLP, dus volgde ik een aantal gratis cursussen van Stanford en Fast.ai om mijn kennis te vergroten. Ik vond het erg leuk om NLP te leren kennen en begon te begrijpen waarom het zo belangrijk is, en waarom kunstmatige intelligentie (AI) het kunnen begrijpen van taal een grote stap is in de richting van de zogenaamde ‘algemene AI’. Deze ervaring heeft mij zeker ertoe aangezet om snel het belang van GPT-3 te begrijpen toen het voor het eerst uitkwam.

Kun je het ontstaansverhaal achter Seek AI delen?

Toen het GPT-3-model van OpenAI uitkwam, herkende ik meteen wat een ongelooflijke vooruitgang het was en raakte vooral enthousiast over toepassingen waarbij GPT-3-code werd geschreven. Ik was tenslotte de hele dag code aan het schrijven als datawetenschapper, en om te zien hoe AI dit deed - en de code perfect genereerde - was adembenemend. Ik zou mijn reactie op GPT-3 vergelijken met de eerste kennismaking met VR in 2013, wat weer een overweldigende ervaring voor mij was. Uiteindelijk besloot ik dat ik een startup moest oprichten om op deze technologie in te zetten. Ik wist niet precies wat ik ging bouwen, maar ik had het gevoel dat als ik meer over deze modellen zou leren, er iets waardevols op zijn plaats zou vallen.

Toen ik de modellen eenmaal echt had leren kennen, besefte ik dat ik een pijnpunt kon oplossen dat ik overal tegenkwam waar ik als quant of als datawetenschapper had gewerkt. Het pijnpunt in kwestie was dat zakenmensen niet over de juiste tools beschikten om hun eigen datavragen te beantwoorden. Als datawetenschapper werkte ik vaak aan problemen die veel focus vereisten, maar ik werd vaak onderbroken door collega's aan de zakelijke kant die vragen hadden over de data, waardoor ik moest stoppen met waar ik mee bezig was. Het proces leek archaïsch en inefficiënt. Ik realiseerde me dat als ik me zou concentreren op deze nieuwe technologie om het probleem op te lossen, het een categoriebepalende oplossing zou zijn voor dit zeer belangrijke en alomtegenwoordige probleem.

Seek AI maakt gebruik van generatieve AI. Kun je onze lezers uitleggen wat dit is?

‘Generatieve AI’ is een zeer gehyped modewoord, maar in tegenstelling tot andere modewoorden geloof ik niet dat de hype ongegrond is. De term verwijst naar grote machine learning-modellen met honderden miljarden parameters, zoals Open AI's DALL-E en GPT-3. De innovatie van deze modellen is dat ze natuurlijke taal kunnen begrijpen en tekst, afbeeldingen, code en meer kunnen genereren. Als je een keer met bijvoorbeeld DALL-E of Stable Diffusion speelt, begrijp je al snel waarom deze modellen zo gehyped zijn; ze hebben een ongelooflijk menselijk vermogen om natuurlijke taalcommando's te begrijpen en kunnen kunst genereren die de beste menselijke kunstenaars evenaart.

Codegeneratie is een van de meest niche-, maar belangrijkste toepassingen van generatieve AI. Gegevens worden groter en complexer, en daarom moeilijker handmatig te analyseren en te organiseren door mensen. Toch is er zoveel informatie gecodeerd in deze gegevens. Deze informatie is niet alleen krachtig voor organisaties, het kan ook leiden tot ongelooflijke wetenschappelijke doorbraken aan de academische kant. Door AI te bouwen om waarde uit gegevens te halen, wordt ongelooflijke waarde ontgrendeld in de vorm van nuttige informatie.

Seek AI bouwt een interface waarmee gebruikers in natuurlijke taal met gegevens kunnen communiceren. Kenniswerkers hebben toegang tot de natuurlijke taalinterface van Seek AI via e-mail, Slack, sms en een reeks CRM-systemen (Customer Relationship Management).

Welke andere soorten machine learning worden gebruikt bij Seek AI?

Hoewel generatieve AI een onderdeel is van onze machine learning-architectuur, bevat onze architectuur ook verschillende forks van open-source deep learning-modellen. Transformatormodellen (waarvan "generatieve AI" een variant is) bevatten veel (maar niet alle) modellen die Seek gebruikt.

Waarom is het zo belangrijk voor niet-technische gebruikers om snel toegang te krijgen tot gegevens?

Wat heb je aan data als het geen ROI genereert, en hoe kan een bedrijf deze ROI behalen als zakelijke gebruikers er niet eens toegang toe hebben? Daarom is het absoluut essentieel om zoveel mogelijk mensen toegang te geven, zonder aan nauwkeurigheid in te boeten.

Toen ik een datawetenschapper was, kreeg ik soms verzoeken van de CEO om wat gegevens te analyseren om te helpen met de product- of go-to-market-strategie van ons bedrijf. Deze projecten kunnen weken of langer duren. Als CEO nu begrijp ik het belang van die projecten zeker op een dieper niveau dan toen ik aan de datakant zat. Ik merk vaak dat ik zou willen dat ik de gegevens gewoon binnen handbereik had, zodat ik sneller beslissingen kon nemen. Dit is een voorbeeld van wat we oplossen bij Seek.

Hoe maakt Seek AI deze gegevens zo gemakkelijk terug te vinden?

Iets dat interessant is om over na te denken, is dat gegevens eigenlijk alleen met code kunnen worden geanalyseerd. Het is waar dat er platforms zijn die abstracties zijn van deze code (bijv. datadashboards), maar onder de motorkap bevindt zich code die handmatig is geschreven door data-analisten waardoor de data aan de zakelijke eindgebruikers kunnen worden gepresenteerd.

De meeste kenniswerkers weten niet hoe ze moeten coderen, willen niet coderen of krijgen gewoon geen toegang tot de gegevens, ook al willen ze code schrijven om deze te analyseren. Daarom moeten ze, wanneer ze gegevens nodig hebben, deze in een dashboard zoeken of het datateam vragen of ze deze niet kunnen vinden. Hoe groter die datasets worden, hoe meer dit zal gebeuren.

Datateams moeten daarom 'vertalers' zijn van natuurlijke taalvragen die aan hen worden gericht, en de data zelf, die ze met behulp van code opvragen. Het verwijderen van deze "vertaler" tussenpersoon is de kern van wat Seek doet.

Hoe zorgen ondernemingen ervoor dat de gegevens die ze gebruiken juist zijn?

Het managen van de afweging tussen gegevensnauwkeurigheid en toegankelijkheid is een enorme uitdaging. Zoals ik in een recent interview heb gezegd, stelt toegankelijkheid aan de ene kant minder technische mensen in staat om interactie aan te gaan met de kennisbron die de gegevens van een bedrijf zijn. Aan de andere kant, wat heb je aan een bron van vervuild water (dwz slechte gegevens)?

De beste datateams zijn degenen die deze afweging op de meest optimale manier beheren, en een groot deel daarvan bestaat uit het zorgvuldig kalibreren en doorlichten van alle tools waarmee niet-technische gebruikers kunnen communiceren.

Wat zijn enkele voorbeelden van use cases voor het Seek AI-platform?

We leveren al waarde aan klanten en ontwerppartners in de verticale markten B2B SaaS, Fintech, Consumer Product Goods (CPG) en B2C e-commerce.

Slagvinis bijvoorbeeld de toonaangevende marktplaats voor alternatieve financiële datasets. Ze geloven dat het geven van snelle, hoogwaardige antwoorden op de vragen van hun eigen klanten het verschil is tussen winnen en verliezen van hun concurrenten. De CEO van het bedrijf, Tim Harrington, merkte op: “Seek AI speelde een cruciale rol in de 2023-strategie van ons bedrijf vanwege de voorsprong die het ons geeft bij het openen en analyseren van onze meer dan 2,400 datasets in antwoord op vragen van klanten. Ik schat dat onze ROI op Seek AI ongeveer 10x is op basis van wat we zouden hebben uitgegeven om dit niveau van efficiëntie te bereiken zonder het platform.”

Is er nog iets dat je zou willen delen over Seek AI?

Dit is misschien de juiste plek voor een schaamteloze plug. Seek biedt momenteel gratis proefversies van ons platform aan, die toegankelijk zijn op zoek.ai. We zijn verheugd om een ​​pionier te zijn in het brengen van generatieve AI naar datateams, en ik kijk ernaar uit om deze reis met onze klanten te maken.

Bedankt voor het geweldige interview, lezers die meer willen weten, zouden moeten bezoeken Zoek AI.

Een van de oprichters van unite.AI en lid van de Forbes Technologieraad, Antoine is een futuristisch die gepassioneerd is over de toekomst van AI en robotica.

Hij is tevens de oprichter van Effecten.io, een website die zich richt op het investeren in disruptieve technologie.