Interviews
Pedro Alves, CEO en oprichter van Ople.ai – Interviewreeks

Pedro Alves is de CEO en oprichter van Ople.ai, een platform dat analisten en specialisten op het gebied van onderwerpen empowerment biedt met krachtige predictieve analytics. Het platform is uitgerust met de kennis en expertise van de wereldberoemde datawetenschappers, zodat gebruikers zich kunnen concentreren op waar ze echt goed in zijn: het creëren van een bedrijfseffect.
Wat trok je aanvankelijk aan tot datawetenschap?
Terug in 2001 zag ik een enorm potentieel in machine learning en kunstmatige intelligentie. Terwijl ik computerwetenschappen studeerde als undergraduate en besloot welk subgebied ik verder wilde ontwikkelen, dacht ik: OK, AI/ML is een gebied van computerwetenschappen dat ik interessant vind – je kunt helpen voorspellen gebeurtenissen in elk veld. Of je nu in biologie, geneeskunde of financiën zit, als je machine learning en AI hebt, kun je die velden aanzienlijk verbeteren. Ik vond de wiskunde erachter fascinerend.
Toen ik naar de graduate school ging, besloot ik dat de beste manier om mijn expertise in machine learning te verbeteren was om te leren hoe ik het kon toepassen. Ik was altijd erg praktisch gericht; ik wilde geen theorie leren voor de theorie zelf. Ik koos ervoor om machine learning te studeren zoals het wordt toegepast in het veld van genomics en proteomics. Al mijn graduate werk was in computationele biologie, maar de focus lag op machine learning.
Kort daarna trad ik toe tot de zorgsector, waar ik een groot potentieel zag voor AI/ML-toepassingen. Dat was het moment waarop ik de problemen zag die AI had in de praktijk, buiten de academische wereld. Ik ervoer de realiteit van AI en leerde hoe ineffectief het in de echte wereld werd toegepast, en niet vanwege technische problemen. Dus werd ik aangetrokken door het oplossen van dat probleem.
Je was voormalig hoofd datawetenschapper bij Banjo, waar je uitdagingen in het sociale netwerkgebied aanpakte. Kun je enkele van die uitdagingen bespreken?
Als bedrijf detecteerden we gebeurtenissen die op sociale media werden opgenomen, met name gebeurtenissen die als potentieel gevaar moesten worden gemarkeerd, zoals een auto-ongeluk in de buurt of een brandend gebouw. We hielpen bij het markeren van deze gebeurtenissen, zodat we eerste hulpverleners konden mobiliseren. We gebruikten sociale media voor het goede doel.
Veel van die gebeurtenissen zijn zeldzaam in vergelijking met sociale mediagegevens. Bijvoorbeeld, er gebeuren elke dag talloze ongelukken in elke stad, maar als je naar het volume van sociale mediagegevens kijkt, wordt een foto van een auto-ongeluk vrij klein. Denk aan de miljoenen foto’s van puppy’s, foto’s van eten, nog een miljoen foto’s van selfies, en dan één foto van een auto-ongeluk, allemaal in een paar minuten. In wezen, bij Banjo, zochten we naar de speld in de hooiberg.
Een van de uitdagingen die zich voordeden, was met betrekking tot computerzicht. Hoewel computerzicht op dat moment redelijk goed was, als je één in een paar miljoen probeert te vinden, kan zelfs een kleine foutenratio je kansen om deze zeldzame gebeurtenissen te detecteren, volledig decimeren.
Bijvoorbeeld, er was een openbare dataset die, wanneer deze werd gebruikt om neurale netwerken te trainen, ervoor zorgde dat ze geen kleur konden identificeren. Zelfs als een foto in de dataset kleurrijk was en het neurale netwerk alle RGB-beelden bekeek, gebruikte het geen kleur als signaal. Neem een traditionele politieauto en een traditionele taxi – beide zijn hetzelfde basisauto-model en een extra stuk apparatuur bovenop (bijv. sirenes op een politieauto of een vrij/bezette indicator op een taxi). Maar als je naar de kleur kijkt, is het verschil tussen de twee duidelijk. Omdat van dit voorbeeld, konden we begrijpen dat het creëren van een juiste dataset essentieel is.
In 2017 lanceerde je vervolgens Ople. Wat is het verhaal achter deze startup?
Ik wilde dat bedrijven een solide ROI zouden ontvangen van de implementatie van AI. Volgens Gartner zien tussen de 80 en 90 procent van de AI-projecten nooit het licht van de dag. Dit heeft niets te maken met technische aspecten, zoals de nauwkeurigheid van het model. Het gaat meestal om de bedrijfscultuur of procedurele aspecten binnen het bedrijf.
Dit kan te wijten zijn aan een gebrek aan voldoende communicatie tussen het datawetenschapteam en de businessgebruiker, waardoor modellen worden gemaakt die iets voorspellen wat het business-team niet nodig heeft, omdat het datawetenschapteam niet begrijpt wat er moet worden gebouwd. Of, als ze het juiste model bouwen, dan gebruikt het business-team de voorspellingen niet eens als het datawetenschapteam klaar is. In de meeste bedrijven zijn het de afdelingen zoals sales, marketing en logistiek die AI echt zouden moeten gebruiken, maar het zijn de datawetenschappers die de modellen begrijpen. Wanneer deze teams de modellen die voor hen worden gebouwd niet begrijpen, vertrouwen ze de voorspellingen niet en gebruiken ze ze dus niet.
Dus, als AI niet verandert hoe het bedrijf zaken doet, wat is het punt?
We wilden een platform creëren dat dit probleem oplost – we willen helpen dat het datawetenschapteam of de businessanalisten, dataanalisten, wie dan ook bij het bedrijf betrokken is bij dit proces – de juiste projecten bouwt en helpt medewerkers de modellen te begrijpen en te vertrouwen. Als we dat oplossen, denk ik dat datawetenschap eindelijk waardevol kan zijn voor bedrijven op een echte manier.
Je hebt verklaard dat datawetenschappers waardevolle tijd verliezen met taken die met AI geautomatiseerd kunnen worden. Kun je enkele voorbeelden geven van taken die geautomatiseerd zouden moeten worden?
Een datawetenschapper zal over het algemeen enkele maanden nodig hebben om een model te voltooien, en zodra het model is voltooid, zal het bedrijf het model implementeren, hoewel het waarschijnlijk niet zo nauwkeurig mogelijk is. In de maanden na de implementatie van het model zal de datawetenschapper het model blijven verbeteren in een poging de nauwkeurigheid van het model met kleine incrementen te verhogen. Dit is meestal waar datawetenschappers hun tijd doorbrengen als ze die tijd zouden kunnen besteden aan andere taken, zoals ervoor zorgen dat medewerkers de AI-modellen begrijpen, vertrouwen en gebruiken. Al die tijd die wordt besteed aan taken zoals feature engineering, modeltraining, parameterafstemming en algoritmekeuze, om de nauwkeurigheid van een model te verhogen, kan gemakkelijk met AI worden geautomatiseerd.
Kunt u uitleggen wat meta-learning is en hoe Ople dit toepast?
Voordat ik over meta-learning begin, is het belangrijk om de eerste laag van machine learning te begrijpen. Laten we zeggen dat je een dataset hebt die voorspelt wanneer machines op een fabrieksvloer zullen breken. De machine zal medewerkers waarschuwen dat deze op het punt staat te breken, zodat ze preventief onderhoud kunnen uitvoeren. Dit wordt de eerste laag van leren genoemd.
Meta-learning, vaak “leren om te leren” genoemd, is het verdere begrijpen van dat leerproces. Dus, terwijl je je model traint om machinefouten te voorspellen, heb je een ander model dat observeert. Bijvoorbeeld, het tweede model kan bedrijven helpen begrijpen welke parameters het predictieve onderhoudsmodel goed leert en welke parameters niet goed werken. Wanneer je meta-learning doet, word je beter in het bouwen van efficiëntere modellen, sneller.
Wat zijn uw meningen over synthetische gegevens?
Synthetische gegevens kunnen ontzettend moeilijk te werken zijn, als ze niet correct worden uitgevoerd.
Stel dat je medische recordgegevens hebt – je hebt 20 patiënten en voor die patiënten heb je hun leeftijd, geslacht, gewicht, lengte, bloeddruk, lijst met medicijnen, enz. Het is mogelijk om synthetische gegevens te creëren met machine learning op basis van deze medische records. Echter, als je alleen op machine learning of statistiek vertrouwt, kun je met nonsensical synthetische gegevens eindigen. Het kan een willekeurige mix en match van waarden creëren, zoals een 3-jarige die 1,80 meter lang is of een 1,20 meter lange persoon die 450 kilo weegt. Terwijl AI/ML in veel gevallen betrouwbaar zijn, zouden synthetische gegevens die voor medische records worden gebruikt, de input van een arts nodig hebben.
Dus, je haalt een medisch professional erbij om parameters te creëren, zoals “als de persoon deze leeftijd heeft, wat is een realistische lengte- en gewichtsrange” of “als ze dit medicijn innemen, welke medicijnen mogen ze niet innemen?” Dit proces zou ongetwijfeld een enorme onderneming worden en te ingewikkeld om alle mogelijkheden in kaart te brengen, zoals ze verband houden met de medische records van elke patiënt.
In het domein van afbeeldingen kunnen synthetische gegevens echter veel gemakkelijker te begrijpen en te creëren zijn. Stel dat je een foto van een auto hebt en de auto staat in de linkerbovenhoek. Je hoeft geen expert te zijn om te weten dat dezelfde auto in de rechteronderhoek, linkeronderhoek of in het midden kan staan. Niet alleen kan iemand een camera op veel manieren richten, maar ze kunnen de foto ook opnieuw uitlijnen. Het verplaatsen van de focus van de foto, zodat de auto in alle hoeken staat, is het creëren van synthetische gegevens – een andere eenvoudige methode is het gebruik van rotatie.
Kunt u enkele voorbeelden geven van hoe Ople bedrijven heeft geholpen met hun gegevensbehoeften?
Ople.AI geeft bedrijven de mogelijkheid om diepgaande data-analyse te gebruiken op alle niveaus van een organisatie en geeft hun medewerkers de kans om de waarde van AI te ontgrendelen, met slechts een paar klikken. In plaats van dat organisaties afhankelijk zijn van een klein team van datawetenschappers om AI te articuleren en te implementeren, rust het Ople.AI-platform medewerkers in verschillende afdelingen uit met de tools om inzichten uit hun gegevens te verkrijgen en hun dagelijkse efficiëntie te verhogen.
Dat gezegd hebbende, is een van de grote obstakels die organisaties vaak tegenkomen bij de implementatie van AI, modelverklaarbaarheid. Het is essentieel voor bedrijven om AI te bieden die hun medewerkers kunnen begrijpen en, belangrijker nog, vertrouwen. Modelverklaarbaarheid helpt daarbij. Ons doel met het Ople.AI-platform is om medewerkers, die mogelijk geen AI- of technische expertise hebben, de kans te geven om gemakkelijk te begrijpen hoe de modellen voorspellingen doen en waarom. Het creëren van modelverklaarbaarheid zal krachtige resultaten opleveren voor bedrijven op de lange termijn.
Bovendien is er veel meer waarde die een model aan bedrijven kan bieden dan alleen voorspellingen doen. AI kan potentiële problemen of gebieden blootleggen die kunnen worden gekapitaliseerd. We noemen dat gegevensverklaarbaarheid – het zijn de verschillende manieren waarop een model intelligente inzichten over gegevens kan delen die waardevol zijn voor een bedrijf. Dit is een belangrijke manier waarop AI bedrijven kan helpen, en een gebied waarin we vooruitgang boeken ten opzichte van onze concurrentie.
Bedankt voor het interview, lezers die meer willen leren, moeten een bezoek brengen aan Ople.ai.












