Intervjuer
Olga Megorskaya, grundare och VD för Toloka – Intervjuserie

Olga Megorskaya, grundare och VD för Toloka, har lett företaget sedan 2020 och styrt det från dess ursprungliga crowd-labeling-rötter till en stor spelare inom AI-data-tjänster. Innan hon grundade och ledde Toloka, tillbringade hon mer än ett decennium på Yandex, där hon kulminerade i en roll som chef för Crowdsourcing och Plattformar, där hon byggde och skalaade crowdsourcade data-etikett-infrastruktur för maskinlärningsprodukter, inklusive sökning, röst, tal, självkörning, innehållsmoderering och mer. Under hennes ledning på Toloka, har företaget positionerat sig som en global data-partner för AI – genom att kombinera maskinlärningsteknologi med mänsklig expertis för att stödja utbildning, utvärdering och säkerhet för stora AI-modeller och agenter.
Toloka är ett Nederländskt företag med huvudkontor i Amsterdam som tillhandahåller högkvalitativa, expertutvalda data för AI-utveckling, från annotering och etikettering till anpassade dataset för övervakad finjustering (SFT) och förstärkt inlärning från mänsklig feedback (RLHF). Företaget stöder en stor variation av modaliteter – text, bild, ljud, video – och engagerar domänexperter tillsammans med en global crowd för att leverera skalbara, precisa dataset för utbildning och utvärdering av avancerade AI-agenter och stora språkmodeller. Deras tjänster hjälper till att förbättra förmågor som resonemang, flerspråkig förståelse, bild/ljudgenerering och AI-säkerhet över branscher och applikationer.
Du tillbringade år med att bygga human-in-the-loop-system på Yandex innan du grundade Toloka 2020. Vilket var det ögonblick som övertygade dig om att detta behövde bli ett eget företag, och hur formade den erfarenheten din vision för Tolokas roll i AI-utveckling?
Vid en viss punkt insåg vi att Toloka hade vuxit ur sitt ursprungsföretag. AI-forskare från hela världen använde plattformen, och vi förstod att företaget kunde uppnå mer som en oberoende enhet. Följaktligen kunde Toloka lita på den ackumulerade erfarenheten från hundratals AI-lag som samlade in utbildningsdata för hela spektret av AI-lösningar – från webbsökning och röstassistenter till GenAI-chattbotar och AI-agenter. Vi har sedan kombinerat vår expertis inom att hantera mänskligt arbete med att bygga och träna AI-agenter för att skapa vår nya produkt, Tendem.
Du har sagt att den verkliga disruptionen framöver inte kommer från fullt autonoma agenter. Vad ledde dig till att dra slutsatsen att hybridagenter – som kombinerar AI-automatisering med mänsklig bedömning – är modellen som kommer att vinna till slut?
Medan jag tror att AI-endast-lösningar i många områden snart kommer att nå en imponerande nivå av kvalitet för att fullständigt tillfredsställa kundernas behov, kommer det alltid att finnas en lång svans av användningsfall som grundläggande modeller aldrig kommer att optimeras för. Det är här hybridtillvägagångssättet kommer att överträffa både AI-endast- och human-endast-lösningar för den närmaste framtiden. Vi har sett samma mönster upprepas om och om igen under det senaste decenniet: AI kan skala uppgifter vackert, men den kämpar med nyans, kontext och de typer av bedömningar som spelar roll i verkliga affärssammanhang. Professionella vill ha hastighet, men de behöver också tillförlitlighet – fullt autonoma agenter kan inte garantera det idag. Hybridsystem vinner eftersom de löser båda sidor av ekvationen. AI hanterar det den är bäst på: hastighet, struktur och upprepningsbarhet. Mänsklig expertis fyller luckorna: tvetydighet, kantfall och tolkning. När du kombinerar de två naturligt, får du en arbetsflöde som är både snabb och pålitlig. Det är modellen som proffsen kommer att lita på.
Du har noterat att AI går sönder på tvetydighet och multi-dokument-resonemang. Vilka typer av uppgifter avslöjar dessa begränsningar tydligast?
Långsiktiga uppgifter – de som kräver syntes av flera källor, försoning av motstridig information eller tolkning av kontext, och som skulle ta människor timmar eller till och med dagar att slutföra – tenderar att avslöja de nuvarande begränsningarna för AI. Exempel inkluderar marknadsundersökningar, konkurrentanalys, sammanfattning av långa dokument, utkast till originalinnehåll från blandade indata eller att dra ut insikter som beror på mänsklig nyans snarare än mönsterigenkänning. AI är utmärkt på att producera en första version. Men i och med att en uppgift kräver prioritering, bedömning eller försoning av tvetydighet, sjunker tillförlitligheten skarpt. Det är där mänskliga experter är avgörande.
Många proffs använder AI men litar fortfarande inte fullständigt på det. Hur återuppbygger din tillvägagångssätt förtroendet för att delegera riktigt arbete till AI-assisterade system?
Förtroendet förbättras när människor inte längre behöver korrigera AI-utdata. Vår tillvägagångssätt återuppbygger förtroendet genom att integrera människor i arbetsflödet från början, inte som en eskalationsväg när AI misslyckas. Varje uppgift i Tendem flödar genom en AI-projektledare som bestämmer vad som ska automatiseras och vad som kräver mänsklig expertis. Efter det säkerställer både automatiserade kontroller och mänsklig kvalitetskontroll att den slutliga utdata är korrekt, fullständig och affärsredo. För proffs betyder det att de kan delegera arbete och faktiskt förvänta sig en verifierad result, inte ett utkast de måste reparera.
Vilka mekanismer säkerställer att mänskliga experter i loopen upprätthåller högkvalitativ utdata utan att sakta ner arbetsflödet?
Två saker gör detta möjligt:
- Specialisering i skala. Experter i Tendems nätverk är förvalda, utbildade och matchade baserat på domänexpertis. De är inte allmänna frilansare som försöker anpassa sig på flyget – de är redan kvalificerade för specifika typer av uppgifter.
- Lagrad kvalitetskontroll och smart routning. AI hanterar bröd-och-smör-stegen så att mänskliga experter bara fokuserar på delarna som kräver bedömning. Sedan finns det ett andra lager av automatiserad kvalitetskontroll och mänsklig verifiering där det behövs. Detta håller människor engagerade där de lägger till mest värde, inte där de skapar flaskhalsar.
Resultatet är hastighet som rivaliserar med automation, med noggrannhet som rivaliserar med expertgranskning.
I branscher som kräver noggrannhet och regelefterlevnad, hur kan hybridsystem erbjuda verifiability och granskbarhet som företag kan lita på?
Hybridsystem tillåter naturligt granskbarhet eftersom varje steg i arbetsflödet spåras, tillskrivs och kvalitetskontrolleras. Du vet vilka delar som automatiserades, vilka som utfördes av validerade experter och vilka kvalitetskontrollsteg validerade utdata. I högt reglerade branscher blir denna process essentiell. Du litar inte längre på en svart-låda-AI-beslut; du har en verifierbar kedja av bedömning, korrektioner och godkännanden. Det är vad som gör hybridsystem lämpliga för domäner där noggrannhet och regelefterlevnad inte kan vara valfria.
Vilka kategorier av kunskapsarbete förväntar du dig kommer att skifta till hybridagenter först, och vilka kommer att vara långsammast att anta denna modell?
Överlag tror jag att hybridtillvägagångssättet är mycket lättare att anta än ett AI-endast-tillvägagångssätt, så vi förväntar oss att nästan alla domäner kan täckas med denna modell – skillnaden kommer bara att ligga i proportionen av AI kontra mänskligt engagemang. De tidigaste antagarna är roller där hastighet och noggrannhet båda spelar roll, men arbetet fortfarande är högt repetitivt. Vi ser redan ett starkt drag från konsultverksamhet, marknadsföring, försäljningsverksamhet, forskning och innehållsskapande. De mest komplexa (och förmodligen de mest intressanta) områdena att lösa är de som ligger närmare den fysiska världen, som arkitektur och byggnad. Men jag ser en tydlig teknisk väg för att komma dit också.
Ur ett operativt perspektiv, hur gynnar sig organisationer när de skiftar från frilansarbeten till hybridagenter?
Hybridagenter eliminerar två av de största ineffektiviteterna i frilansarbeten: ledningsöverhuvud och inkonsekvent kvalitet. Organisationer och proffs behöver inte längre rekrytera, validera, informera, hantera eller korrigera frilansare. Hybridagenten hanterar arbetsflödesorkestrering automatiskt, tilldelar rätt kombination av AI och mänsklig expertis för varje steg. Detta minskar omsättningstiden, standardiserar utdatakvalitet och skalar arbete utan att öka personalstyrkan. Kort sagt: du får hastigheten hos automation med tillförlitligheten hos ett expertteam, men utan att hantera något av dem.
När hybridsystem får allmän acceptans, vad förväntar du dig att denna förändring kommer att ha för påverkan på den bredare frilans- och gig-ekonomin?
Vi tror att det kommer att omforma frilans-ekonomin, inte ersätta den. Istället för att frilansare tillbringar tid på lågnivå, repetitiva uppgifter, kan de ansluta till hybridsystem som specialister inom specifika domäner. Arbetet blir mer strukturerat: högvärdigt, mer förutsägbart och mer stabilt. Snarare än att jaga inkonsekventa projekt, kan experter bidra i skala genom plattformar som Tendem, där deras färdigheter matchas till rätt uppgifter och stöds av AI-system som tar bort tråkigt arbete.
Om några år, vad ser “delegering till AI” ut som när hybridagenter blir standard över hela digitala arbete?
Delegering kommer att kännas mindre som “använda ett verktyg” och mer som att lämna över arbete till ett kapabelt team. Du kommer att beskriva den önskade resultatet, och hybridagenten kommer att bryta ner det, dirigera underuppgifter, applicera rätt mix av AI och mänsklig expertis, validera resultaten och leverera en färdig produkt – allt inom några timmar. Förändringen kommer att vara från att använda AI som ett utkastsassistent, till att lita på AI som en projektledare som övervakar hela arbetsflödet. Det är när den verkliga delegeringen sker: när proffs kan lita på systemet för att leverera den slutliga utdata, inte bara en startpunkt.
Tack för den underbara intervjun, läsare som vill lära sig mer kan besöka Toloka.












