Interviews
Mike Capps, mede-oprichter & CEO van Diveplane – Interviewreeks

Dr. Michael Capps is een bekende technoloog en CEO van Diveplane Corporation. Voordat hij Diveplane mede-oprichtte, had Mike een legendarische carrière in de videogame-industrie als president van Epic Games, makers van blockbusters Fortnite en Gears of War. Zijn ambtstermijn omvatte honderd game-of-the-year-prijzen, tientallen conferentiekeynotes, een lifetime achievement award en een succesvolle verdediging van videogames in de Amerikaanse Hoge Raad.
Diveplane biedt AI-gestuurde bedrijfsoplossingen in meerdere industrieën. Met zes goedgekeurde octrooien en meerdere aanvragen in behandeling, biedt de Understandable AI van Diveplane een volledig begrip en besluitvormingstransparantie ter ondersteuning van ethische AI-beleid en gegevensbeschermingsstrategieën.
U bent met pensioen gegaan uit een succesvolle carrière in de videogame-industrie bij Epic Games, wat heeft u geïnspireerd om uit uw pensioen te komen en u te focussen op AI?
Het maken van games was een blast, maar – tenminste op dat moment – was het geen ideale carrière als je een nieuw gezin had. Ik hield me bezig met bestuursfuncties en adviesrollen, maar het was gewoon niet vervullend. Dus maakte ik een lijst van drie grote problemen waarmee de wereld kampt en die ik mogelijk kon beïnvloeden – en dat includede de verspreiding van black-box AI-systemen. Mijn plan was om een jaar te besteden aan elk onderwerp, maar een paar weken later vertelde mijn briljante vriend Chris Hazard me dat hij in het geheim had gewerkt aan een transparant, volledig uitlegbaar AI-platform. En hier zijn we.
Diveplane is opgericht met de missie om humaniteit toe te voegen aan AI, kunt u specifiek uitleggen wat dit betekent?
Zeker. Hier gebruiken we humaniteit om “menselijkheid” of “compassie” te bedoelen. Om ervoor te zorgen dat het beste van de mensheid in uw AI-model zit, kunt u niet zomaar trainen, testen en hopen dat het allemaal oké is.
We moeten de invoergegevens, het model zelf en de uitvoer van dat model zorgvuldig controleren en ervoor zorgen dat het het beste van onze mensheid weerspiegelt. De meeste systemen die zijn getraind op historische of werkelijke gegevens zullen niet meteen correct zijn en zijn niet noodzakelijkerwijs onbevooroordeeld. We geloven dat de enige manier om vooroordelen in een model uit te roeien – wat zowel statistische fouten als vooroordelen betekent – de combinatie is van transparantie, controleerbaarheid en menselijk-uitlegbare verklaring.
De kern technologie bij Diveplane heet REACTOR, wat maakt dit een noviteit in de benadering van uitlegbare machine learning?
Machine learning houdt meestal in dat u gegevens gebruikt om een model te bouwen dat een bepaald type beslissing neemt. Beslissingen kunnen onder meer het aantal graden omhoog of omlaag voor een voertuig omhoog of omlaag te draaien, of om een aankoop goed te keuren of af te keuren, of welk product aan iemand aan te bevelen. Als u wilt weten hoe het model de beslissing heeft genomen, moet u het model meestal vragen om veel soortgelijke beslissingen te nemen en dan proberen te voorspellen wat het model zelf zou doen. Machine learning-technieken zijn meestal beperkt in de soorten inzichten die ze kunnen bieden, door ofwel de inzichten die ze bieden niet weerspiegelen wat het model heeft gedaan om tot de beslissing te komen, of door een lagere nauwkeurigheid te hebben.
Werken met REACTOR is heel anders. REACTOR karakteriseert de onzekerheid van uw gegevens en uw gegevens worden het model. In plaats van één model per type beslissing te bouwen, vraagt u REACTOR gewoon wat u wilt dat het beslist – het kan alles zijn dat verband houdt met de gegevens – en REACTOR vraagt welke gegevens nodig zijn voor een bepaalde beslissing. REACTOR kan u altijd laten zien welke gegevens het heeft gebruikt, hoe het verband houdt met het antwoord, elk aspect van onzekerheid, contrafactueel redeneren en vrijwel elke andere vraag die u wilt stellen. Omdat de gegevens het model zijn, kunt u de gegevens bewerken en REACTOR wordt onmiddellijk bijgewerkt. Het kan u laten zien of er gegevens waren die afwijkend leken en die bij de beslissing zijn betrokken, en elk bewerkingsproces van de gegevens en de bron ervan traceren. REACTOR gebruikt probabiliteitstheorie helemaal tot het einde, wat betekent dat we u de eenheden van meting van elk onderdeel van de werking kunnen vertellen. En ten slotte kunt u elke beslissing reproduceren en valideren met alleen de gegevens die tot de beslissing hebben geleid en de onzekerheden, met behulp van relatief eenvoudige wiskunde zonder REACTOR nodig te hebben.
REACTOR kan al dit doen en toch een hoge nauwkeurigheid behouden, vooral voor kleine en schaarse gegevenssets.
GEMINAI is een product dat een digitale tweeling van een gegevensset bouwt, wat betekent dit specifiek en hoe garandeert dit gegevensbescherming?
Wanneer u GEMINAI een gegevensset voedt, bouwt het een diepe kennis van de statistische vorm van die gegevens. U kunt het gebruiken om een synthetische tweeling te creëren die de structuur van de oorspronkelijke gegevens lijkt, maar alle records zijn nieuw gemaakt. Maar de statistische vorm is hetzelfde. Dus bijvoorbeeld, het gemiddelde hartfrequentie van patiënten in beide sets zou bijna hetzelfde zijn, evenals alle andere statistieken. Dus elke gegevensanalyse met de tweeling zou hetzelfde antwoord geven als de oorspronkelijke gegevens, inclusief het trainen van ML-modellen.
En als iemand een record in de oorspronkelijke gegevens heeft, zou er geen record voor hen in de synthetische tweeling zijn. We verwijderen niet alleen de naam – we zorgen ervoor dat er geen nieuw record is dat “dichtbij” hun record (en alle andere) in de informatieruimte is. D.w.z. er is geen record dat herkenbaar is in zowel de oorspronkelijke als de synthetische set.
En dat betekent dat de synthetische gegevensset veel vrijer kan worden gedeeld zonder het risico om vertrouwelijke informatie onjuist te delen. Het maakt niet uit of het gaat om persoonlijke financiële transacties, patiëntgegevens, geclassificeerde gegevens – zolang de statistieken van de gegevens niet vertrouwelijk zijn, is de synthetische tweeling niet vertrouwelijk.
Waarom is GEMINAI een betere oplossing dan het gebruik van differentiële privacy?
Differentiële privacy is een set technieken die de kans dat een individu de statistieken beïnvloedt, beperkt tot een marginale hoeveelheid, en is een fundamenteel onderdeel in bijna elke gegevensbeschermingsoplossing. Echter, wanneer differentiële privacy alleen wordt gebruikt, moet een privacybudget voor de gegevens worden beheerd, met voldoende ruis toegevoegd aan elke query. Zodra dit budget is gebruikt, kunnen de gegevens niet opnieuw worden gebruikt zonder privacyrisico’s te lopen.
Een manier om dit budget te overwinnen is om het volledige privacybudget in één keer toe te passen om een machine learning-model te trainen om synthetische gegevens te genereren. Het idee is dat dit model, getraind met differentiële privacy, relatief veilig kan worden gebruikt. Echter, de juiste toepassing van differentiële privacy kan moeilijk zijn, vooral als er verschillende gegevensvolumes zijn voor verschillende individuen en meer complexe relaties, zoals mensen die in hetzelfde huis wonen. En synthetische gegevens die zijn gegenereerd met dit model, zijn vaak waarschijnlijk om echte gegevens te bevatten die een individu kan claimen als hun eigen gegevens, omdat ze te veel lijken.
GEMINAI lost deze problemen op en meer door meerdere privacytechnieken te combineren bij het synthetiseren van de gegevens. Het gebruikt een praktische vorm van differentiële privacy die een breed scala aan gegevenstypen kan accommoderen. Het is gebouwd op onze REACTOR-motor, dus het weet ook de kans dat stukken gegevens met elkaar verward kunnen worden, en synthetiseert gegevens om ervoor te zorgen dat ze altijd voldoende verschillend zijn van de meest vergelijkbare oorspronkelijke gegevens. Bovendien behandelt het elke veld, elk stukje gegevens als potentieel gevoelig of identificerend, dus het past praktische vormen van differentiële privacy toe voor velden die niet traditioneel als gevoelig worden beschouwd, maar die een individu uniek kunnen identificeren, zoals de enige transactie in een 24-uurswinkel tussen 2 en 3 uur ‘s nachts. We noemen dit vaak privacy cross-shredding.
GEMINAI kan al dit doen en toch een hoge nauwkeurigheid bereiken voor bijna elk doel, dat lijkt op de oorspronkelijke gegevens, maar voorkomt dat iemand synthetische gegevens vindt die te veel lijken op de synthetische gegevens.
Diveplane was instrumenteel in het mede-oprichten van de Data & Trust Alliance, wat is deze alliantie?
Het is een absoluut fantastische groep van technologie-CEO’s, die samenwerken om verantwoorde gegevens- en AI-praktijken te ontwikkelen en te adopteren. Wereldklasse-organisaties zoals IBM, Johnson&Johnson, Mastercard, UPS, Walmart en Diveplane. We zijn erg trots om deel te hebben genomen aan de vroege stadia en ook trots op het werk dat we collectief hebben verricht aan onze initiatieven.
Diveplane heeft onlangs een succesvolle Series A-rondes gefinancierd, wat zal dit betekenen voor de toekomst van het bedrijf?
We zijn fortuinlijk geweest met onze ondernemingsprojecten, maar het is moeilijk om de wereld te veranderen, één onderneming tegelijk. We zullen deze steun gebruiken om ons team op te bouwen, onze boodschap te delen en Understandable AI in zoveel mogelijk plaatsen te krijgen!
Is er nog iets anders dat u wilt delen over Diveplane?
Diveplane gaat over het zorgen dat AI op de juiste manier wordt gedaan, nu het zich verspreidt. We zijn voor eerlijke, transparante en uitlegbare AI, proactief laten zien wat de beslissingen drijft, en weggaan van de “black box-mentaliteit” in AI die het potentieel heeft om oneerlijk, onethisch en bevooroordeeld te zijn. We geloven dat uitlegbaarheid de toekomst van AI is, en we zijn enthousiast om een cruciale rol te spelen in het stimuleren ervan!
Bedankt voor het geweldige interview, lezers die meer willen leren, moeten Diveplane bezoeken.












