Interviews
Pedro Alves, CEO en oprichter van Ople.ai – Interviewreeks

Pedro Alves is de CEO en oprichter van Ople.ai, een platform dat analisten en specialisten op het gebied van onderwerp empowerd met krachtige predictieve analytics. Het platform is uitgerust met de kennis en expertise van de werelds toonaangevende datawetenschappers, zodat gebruikers zich kunnen concentreren op waar ze echt goed in zijn: het creëren van een bedrijfseffect.
Wat trok je aanvankelijk aan naar datawetenschap?
Terug in 2001 zag ik enorm potentieel in machine learning en kunstmatige intelligentie. Terwijl ik computerwetenschap als undergraduate studeerde en besloot welk subveld ik verder wilde ontwikkelen, dacht ik: OK, AI/ML is een gebied van computerwetenschap dat ik interessant vind – je kunt helpen voorspellen gebeurtenissen in elk veld. Of je nu in biologie, geneeskunde of financiën zit, als je machine learning en AI hebt, kun je die velden aanzienlijk verbeteren. Ik vond de wiskunde erachter fascinerend.
Toen ik naar de graduate school ging, besloot ik dat de beste manier om mijn expertise in machine learning te verbeteren was om te leren hoe ik het kon toepassen. Ik was altijd heel praktisch; ik wilde geen theorie leren voor de sake van theorie. Ik koos ervoor om machine learning te studeren zoals het wordt toegepast in het veld van genomics en proteomics. Al mijn graduate werk was in computationele biologie, maar de focus lag op machine learning.
Kort daarna ging ik de zorgindustrie in, waar ik een groot potentieel zag voor AI/ML-toepassingen. Dat is wanneer ik begon te zien welke problemen AI had in de praktijk, buiten de academische wereld. Ik ervoer de realiteit van AI en leerde hoe ineffectief het was toegepast in de echte wereld, en niet vanwege technische problemen. Dus werd ik aangetrokken door het oplossen van het probleem.
Je was voormalig chief data scientist bij Banjo, waar je uitdagingen in het sociale netwerkgebied aanpakte. Kun je enkele van die uitdagingen bespreken?
Als bedrijf detecteerden we gebeurtenissen die op sociale media werden opgenomen, met name gebeurtenissen die als een potentieel gevaar moesten worden gemarkeerd, zoals een auto-ongeluk of een brandend gebouw. We hielpen deze gebeurtenissen te markeren, zodat we konden helpen eerste hulpverleners te mobiliseren. We gebruikten sociale media voor het goede.
Veel van deze gebeurtenissen zijn zeldzaam in vergelijking met sociale media-gegevens. Bijvoorbeeld, er zijn talloze ongevallen die elke dag in elke stad gebeuren, maar als je naar het volume van sociale media-gegevens kijkt, wordt een foto van een auto-ongeluk vrij klein. Denk aan de miljoenen foto’s van puppy’s, foto’s van eten, nog een miljoen foto’s van selfies, en dan één foto van een auto-ongeluk, allemaal in een paar minuten. In wezen, bij Banjo, waren we de naald in de hooiberg aan het zoeken.
Een van de uitdagingen die opkwamen was met betrekking tot computer vision. Hoewel computer vision op dat moment redelijk goed was, als je één in een paar miljoen probeert te vinden, kan zelfs een kleine foutkans je kansen om deze zeldzame gebeurtenissen te detecteren volledig decimeren.
Bijvoorbeeld, er was een openbare dataset die, wanneer deze werd gebruikt om neurale netwerken te trainen, zou veroorzaken dat ze niet in staat waren om kleur te identificeren. Zelfs als een foto in de dataset kleurrijk was en het neurale netwerk naar alle RGB keek, gebruikte het geen kleur als signaal. Neem een traditionele politieauto en een traditionele taxi – beide zijn hetzelfde basismodel auto en een extra stuk apparatuur bovenop (bijv. sirenes op een politieauto of een vrij/bezettoets op een taxi). Maar als je naar de kleur kijkt, is het verschil tussen de twee duidelijk. Omdat van deze instantie, konden we begrijpen dat het creëren van een juiste dataset essentieel is.
In 2017 lanceerde je vervolgens Ople. Wat was het verhaal achter deze startup?
Ik wilde dat bedrijven een solide ROI zouden krijgen van het implementeren van AI. Volgens Gartner zien tussen 80 en 90 procent van de AI-projecten nooit het licht van de dag. Dit heeft niets te maken met technische aspecten, zoals de nauwkeurigheid van het model. Het is meestal bedrijfscultuur of procedurele aspecten binnen het bedrijf.
Dit kan te wijten zijn aan een gebrek aan voldoende communicatie tussen het datawetenschapteam en de businessgebruiker, wat leidt tot modellen die iets voorspellen wat het business-team niet nodig heeft, omdat het datawetenschapteam niet begrijpt wat er moet worden gebouwd. Of, als ze het juiste model bouwen, dan gebruikt het business-team de voorspellingen niet eens als het datawetenschapteam klaar is. In de meeste bedrijven zijn het de afdelingen zoals verkoop, marketing en logistiek die AI echt zouden moeten gebruiken, maar het zijn de datawetenschapteams die de modellen begrijpen. Wanneer deze teams de modellen die voor hen worden gebouwd niet begrijpen, vertrouwen ze de voorspellingen niet en gebruiken ze ze dus niet.
Dus, als AI niet verandert hoe het bedrijf zaken doet, wat is het punt?
We wilden een platform creëren dat dit oplost – we willen helpen het datawetenschapteam of de businessanalisten, dataanalisten, wie dan ook betrokken is bij het bedrijf in dit proces – de juiste projecten bouwen en helpen medewerkers de modellen te begrijpen en te vertrouwen. Als we dat oplossen, denk ik dat datawetenschap eindelijk waardevol kan zijn voor bedrijven op een echte manier.
Je hebt verklaard dat datawetenschappers waardevolle tijd verliezen met taken die met AI geautomatiseerd kunnen worden. Kun je enkele voorbeelden geven van taken die geautomatiseerd zouden moeten worden?
Een datawetenschapper zal over het algemeen enkele maanden nodig hebben om een model te voltooien, en zodra het model is voltooid, zal het bedrijf het model implementeren, hoewel het waarschijnlijk niet zo nauwkeurig mogelijk is. In de maanden na de implementatie van het model zal de datawetenschapper het model blijven verbeteren in een poging de nauwkeurigheid van het model met kleine incrementen te verhogen. Dit is over het algemeen waar veel datawetenschappers hun tijd aan besteden als ze hun tijd zouden kunnen besteden aan andere taken, zoals ervoor zorgen dat medewerkers de AI-modellen begrijpen, vertrouwen en gebruiken. Al die tijd die wordt besteed aan taken zoals feature engineering, modeltraining, parameterafstemming en algoritmekeuze, om de nauwkeurigheid van een model te verhogen, kan gemakkelijk met AI worden geautomatiseerd.
Kun je uitleggen wat meta-learning is en hoe Ople dit toepast?
Voordat ik over meta-learning begin, is het belangrijk om de eerste laag van machine learning te begrijpen. Laten we zeggen dat je een dataset hebt die voorspelt wanneer machines op een fabrieksvloer zullen breken. De machine zal medewerkers waarschuwen dat het op het punt staat te breken, zodat ze preventief onderhoud kunnen uitvoeren. Dit wordt beschouwd als de eerste laag van leren.
Meta-learning, vaak bekend als “leren om te leren”, is het verder begrijpen van dat leerproces. Dus, terwijl je je model traint om machinefouten te voorspellen, heb je een ander model dat observeert. Bijvoorbeeld, het tweede model kan bedrijven helpen begrijpen welke parameters het predictieve onderhoudsmodel goed leert en welke parameters niet goed werken. Wanneer je meta-learning doet, word je beter in het bouwen van efficiëntere modellen, sneller.
Wat zijn je meningen over synthetische gegevens?
Synthetische gegevens kunnen erg moeilijk te werken zijn, als ze niet correct worden uitgevoerd.
Laten we zeggen dat je medische recordgegevens hebt – je hebt 20 patiënten en voor die patiënten heb je hun leeftijd, geslacht, gewicht, lengte, bloeddruk, lijst van medicijnen, enz. Het is mogelijk om synthetische gegevens te creëren met machine learning op basis van deze medische records. Echter, als je alleen op machine learning of statistiek vertrouwt, kun je met nonsensical synthetische gegevens eindigen. Het kan een willekeurige mix en match van waarden creëren, zoals een 3-jarige die 1,80 meter lang is of een 1,20 meter lange persoon die 450 kilo weegt. Terwijl AI/ML in veel gevallen betrouwbaar zijn, zou synthetische gegevens voor medische records een artsenspecialist nodig hebben.
Dus, je krijgt een medisch professional bij het creëren van parameters, zoals “als de persoon deze leeftijd heeft, wat is een realistische lengte- en gewichtsrange” of “als ze dit medicijn innemen, welke medicijnen mogen ze niet innemen?” Dit proces zou ongetwijfeld een enorme onderneming worden en te ingewikkeld om alle mogelijkheden in kaart te brengen, zoals ze betrekking hebben op elk medisch record van elke patiënt.
In het rijk van afbeeldingen kan synthetische gegevens echter veel gemakkelijker te begrijpen en creëren zijn. Zeg dat je een foto van een auto hebt en de auto staat in de linkerbovenhoek. Je hoeft geen expert te zijn om te weten dat dezelfde auto in de rechteronderhoek, linkerbovenhoek of in het midden kan staan. Niet alleen kan de persoon de camera op veel manieren richten, maar ze kunnen de foto ook opnieuw uitlijnen. Het verplaatsen van de focus van de foto, zodat de auto in alle hoeken staat, is het creëren van synthetische gegevens – een andere eenvoudige methode is het gebruik van rotatie.
Kun je enkele voorbeelden geven van hoe Ople bedrijven heeft geholpen met hun gegevensbehoeften?
Ople.AI geeft bedrijven de mogelijkheid om diepgaande data-analyse te gebruiken op alle niveaus van een organisatie en geeft hun medewerkers de kans om de waarde van AI te ontgrendelen, met slechts een paar klikken. In plaats van dat organisaties afhankelijk zijn van een klein team van datawetenschappers om AI te articuleren en te implementeren, rust het Ople.AI-platform medewerkers in verschillende afdelingen uit met de tools om inzichten uit hun gegevens te halen en hun dagelijkse efficiëntie te verhogen.
Met dat gezegd, is een van de grote hindernissen die organisaties vaak tegenkomen bij de implementatie van AI, modelverklaring. Het is essentieel voor bedrijven om AI te bieden die hun medewerkers kunnen begrijpen en, belangrijker nog, vertrouwen. Modelverklaring helpt daarbij. Ons doel met het Ople.AI-platform is om medewerkers, die mogelijk geen AI- of technische expertise hebben, de kans te geven om gemakkelijk te begrijpen hoe de modellen voorspellingen doen en waarom. Het creëren van modelverklaring zal krachtige resultaten opleveren voor bedrijven op de lange termijn.
Bovendien is er veel meer waarde die een model aan bedrijven kan brengen dan alleen voorspellingen doen. AI kan potentiële problemen of gebieden blootleggen die kunnen worden geëxploiteerd. We noemen dat gegevensverklaring – het zijn de verschillende manieren waarop een model intelligente inzichten over gegevens kan delen die waardevol zijn voor een bedrijf. Dit is een belangrijke manier waarop AI bedrijven kan helpen, en een gebied waarin we vooruitgang boeken ten opzichte van onze concurrentie.
Bedankt voor het interview, lezers die meer willen leren, moeten bezoeken Ople.ai.












