Intervjuer
Pedro Alves, VD och grundare av Ople.ai – Intervjuserie

Pedro Alves är VD och grundare av Ople.ai, en plattform som ger analytiker och ämnesexperter kraftfulla prediktiva analyser. Plattformen är utrustad med kunskap och expertis från världens ledande dataforskare så att användare kan fokusera på vad de är riktigt bra på: att skapa affärsvärde.
Vad var det som initialt drog dig till datavetenskap?
Tillbaka 2001 såg jag ett enormt potential i maskinlärning och artificiell intelligens. Medan jag studerade datavetenskap som grundutbildning och bestämde mig för vilket område jag skulle fortsätta med, tänkte jag: OK, AI/ML är ett område inom datavetenskap som jag tycker är intressant – du kan hjälpa förutsäga händelser i vilket område som helst. Oavsett om du är inom biologi, medicin eller finans, om du har maskinlärning och AI, kan du avsevärt förbättra dessa områden. Jag tyckte alltid att matematiken bakom det var fascinerande.
När jag började studera på masternivå bestämde jag mig för att den bästa vägen att förbättra min expertis inom maskinlärning skulle vara att lära mig hur man tillämpar det. Jag var alltid mycket praktisk; jag ville inte lära mig teori bara för teoris skull. Jag valde att studera maskinlärning eftersom det appliceras på området genetik och proteomik. All min forskning på masternivå var inom beräkningsbiologi, men fokuset låg på maskinlärning.
Snart därefter gick jag in i vården, där jag såg stort potential för AI/ML-tillämpningar. Då började jag se de problem som AI hade i praktiken, utanför akademin. Jag upplevde verkligheten med AI och lärde mig hur ineffektivt det hade tillämpats i den riktiga världen, och inte på grund av tekniska problem. Så jag blev då dragningen till att lösa problemet.
Du var tidigare chefsdataforskare på Banjo, där du hanterade utmaningar inom sociala nätverksområdet. Kan du diskutera några av dessa utmaningar?
Som företag upptäckte vi händelser som registrerades på sociala medier, specifikt händelser som behövde belysas som en potentiell fara, som en bilkrasch i närheten eller en byggnad som brann. Vi hjälpte till att flagga dessa händelser, så att vi kunde mobilisera första hjälpen. Vi använde sociala medier för att göra gott.
Många av dessa händelser är sällsynta i förhållande till sociala mediedata. Till exempel sker det många krascher varje dag i en given stad, men när du tittar på volymen av sociala mediedata, blir en bild av en bilkrasch ganska liten. Tänk på miljontals bilder av valpar, bilder av mat, en miljon bilder av selfies och sedan en bild av en bilkrasch, allt inom loppet av några minuter. I princip letade vi på Banjo efter en nål i en höstack.
En av utmaningarna som uppstod var relaterad till datorseende. Även om datorseende var hyggligt på den tiden, när du försöker hitta en på några miljoner, kan en liten felprocent helt förstöra dina chanser att upptäcka dessa sällsynta händelser.
Till exempel fanns det en offentlig datamängd som, när den användes för att träna neurala nätverk, gjorde att de inte kunde identifiera färger. Även om en bild i datamängden var färgglad och det neurala nätverket tittade på alla RGB, använde det inte färg som en indikator. Ta en traditionell polisbil och en traditionell taxi – båda är i princip samma bilmodell och en extra enhet på toppen (t.ex. sirener på en polisbil eller en ledig/upptagen-signal på en taxi). Men om du tittar på färgen är skillnaden mellan de två uppenbar. Eftersom vi kunde förstå att skapandet av en korrekt datamängd är avgörande.
2017 startade du sedan Ople. Vad var ursprunget till den här startupen?
Jag ville att företag skulle få en solid avkastning på investeringen när de implementerade AI. Enligt Gartner ser 80 till 90 procent av AI-projekten aldrig dagens ljus. Detta har ingenting att göra med tekniska aspekter, som modellens noggrannhet. Det är vanligtvis företagskultur eller procedurfrågor inom företaget.
Detta kan bero på bristande kommunikation mellan dataforskningsgruppen och företagsanvändarna, vilket leder till modeller som förutsäger något som företagsgruppen inte behövde, eftersom dataforskningsgruppen inte förstod vad som behövde byggas. Eller, om de bygger den rätta modellen, så när dataforskningsgruppen är klar, så utnyttjar inte företagsgruppen förutsägelserna alls. I de flesta företag är det avdelningar som försäljning, marknadsföring och logistik som verkligen borde använda AI, men det är dataforskningsgruppen som förstår modellerna. När dessa grupper inte förstår modellerna som byggs för dem, tenderar de att inte lita på dess förutsägelser och därför inte använda dem.
Så, om AI inte förändrar hur företaget bedriver sin verksamhet, vad är meningen?
Vi ville skapa en plattform som löser det här problemet – vi vill hjälpa dataforskningsgruppen eller företagsanalytiker, dataanalytiker, vem som helst som är involverad i företaget i den här processen – att bygga rätt projekt och hjälpa anställda att förstå och lita på modellerna. Om vi löser det, så tror jag att dataforskning kan bli värdefull för företag på riktigt.
Du har sagt att dataforskare förlorar värdefull tid med att utföra uppgifter som kan automatiseras med AI. Vilka är några exempel på uppgifter som bör automatiseras?
En dataforskare tar vanligtvis flera månader på sig att slutföra en modell, och när den är färdig, så implementerar företaget modellen, men den kommer förmodligen inte att vara så noggrann som möjligt. Under de följande månaderna efter modellens implementering kommer dataforskaren att fortsätta att arbeta med den i ett försök att öka modellens noggrannhet med små inkrementella ökningar. Det är vanligtvis där många dataforskare tillbringar sin tid, när de kunde tillbringa tiden med att göra andra uppgifter, som att se till att anställda förstår, litar på och använder AI-modellerna som finns på plats. All den tid som tillbringas på uppgifter som funktionell utformning, modellträning, parametertuning och algoritmväljning, i ett försök att öka en modells noggrannhet, kan enkelt automatiseras med AI.
Kan du beskriva vad meta-lärande är och hur Ople tillämpar detta?
Innan jag kommer till meta-lärande är det viktigt att förstå den första nivån av maskinlärning. Låt oss säga att du har en datamängd som förutsäger när maskiner kommer att gå sönder på en fabriksgolvyta. Maskinen meddelar anställda att den är på väg att gå sönder, så att de kan utföra förebyggande underhåll. Detta kallas den första nivån av lärande.
Meta-lärande, ofta kallat “lärande att lära”, är att ytterligare förstå lärandeprocessen. Så, när du tränar din modell för att förutsäga maskinfel, har du en annan modell som observerar. Till exempel kunde den andra modellen hjälpa företag att förstå vilka parametrar den prediktiva underhållsmodellen lär sig bra, och vilka parametrar som inte fungerar bra. När du gör meta-lärande, blir du bättre på att bygga mer effektiva modeller, snabbare.
Vad är din syn på syntetisk data?
Syntetisk data kan vara otroligt svår att arbeta med, om den inte utförs korrekt.
Låt oss säga att du har medicinska journaler – du har 20 patienter, och för dessa patienter har du deras ålder, kön, vikt, längd, blodtryck, lista över mediciner, etc. Det är möjligt att skapa syntetisk data med maskinlärning baserat på dessa medicinska journaler. Men, om du enbart förlitar dig på maskinlärning eller statistik, kan du hamna med meningslös syntetisk data. Det kan skapa en slumpmässig blandning och matchning av värdena, som en 3-åring som är sex fot lång eller en 4-fot-lång person som väger tusen pund. Medan AI/ML är tillförlitliga i många fall, skulle syntetisk data som används för medicinska journaler behöva ha en läkares input.
Så, du får en medicinsk professionell att skapa parametrar, som “om personen är den här åldern, vad är ett realistiskt höjd- och viktintervall”, eller “om de tar den här medicinen, vilka mediciner bör de inte ta?” Detta förfarande skulle otvivelaktigt bli en enorm uppgift och för komplicerat att kartlägga alla möjligheter, eftersom de gäller varje patients medicinska journaler.
Inom bildområdet kan syntetisk data dock vara mycket enklare att förstå och skapa. Säg att du har en bild av en bil, och bilen är placerad i övre vänstra hörnet. Du behöver inte vara en expert för att veta att samma bil kunde vara i nedre vänstra hörnet, övre högra hörnet eller i mitten. Inte bara kan personen peka en kamera på många sätt, men de kan också justera bilden. Att flytta fokus för bilden, så att bilen är i alla olika hörn, är att skapa syntetisk data – ett annat enkelt sätt är att använda rotation.
Kan du ge några exempel på hur Ople hjälpte företag med deras databehov?
Ople.AI ger företag möjligheten att använda djupgående dataanalys på alla nivåer i en organisation och ge deras anställda möjligheten att låsa upp värdet av AI, med bara några klick. Till skillnad från att företag förlitar sig på en liten grupp dataforskare för att formulera och implementera AI, utrustar Ople.AI-plattformen anställda i olika avdelningar med verktygen för att få tillgång till insikter från deras data och därmed öka sin dagliga effektivitet.
Med det sagt är en stor utmaning som företag ofta står inför när de implementerar AI modellförklarbarhet. Det är viktigt för företag att erbjuda AI som deras anställda kan förstå, och ännu viktigare, lita på. Modellförklarbarhet hjälper till med det. Vårt mål med Ople.AI-plattformen är att ge anställda, som kanske inte är AI- eller teknikexperter, möjligheten att enkelt förstå hur modellerna gör förutsägelser och varför. Att skapa modellförklarbarhet kommer att generera kraftfulla resultat för företag på lång sikt.
Dessutom finns det mycket mer värde en modell kan ge till företag utöver att göra förutsägelser. AI kan avslöja potentiella problem eller områden som kan utnyttjas. Vi kallar det dataförklarbarhet – det är de olika sätten en modell kan dela intelligenta insikter om data som är värdefulla för ett företag. Detta är ett stort sätt AI kan hjälpa företag, och ett område vi förbättrar i förhållande till vår konkurrens.
Tack för intervjun, läsare som vill lära sig mer bör besöka Ople.ai.












