Interviews
Ryan Kolln, CEO bij Appen – Interview Serie

Ryan Kolln is de Chief Executive Officer en Managing Director van Appen. Ryan heeft meer dan 20 jaar ervaring in technologie en telecommunicatie, evenals een diepe kennis van Appen’s bedrijf en de AI-industrie.
Zijn professionele carrière begon als ingenieur, met een focus op mobiele netwerkgegevensengineering in Australië, Azië en Noord-Amerika. Na het behalen van een MBA aan de New York University, sloot Ryan zich in 2011 aan bij The Boston Consulting Group (BCG) als strategisch consultant. Tijdens zijn tijd bij BCG specialiseerde hij zich in technologie en telecommunicatie en verwierf hij diepe strategische expertise op een breed scala aan groei- en operationele onderwerpen.
Toen hij in 2018 bij Appen AI kwam als VP of Corporate Development, leidde hij strategische overnames zoals Figure Eight en Quadrant, en ondersteunde hij de oprichting van de China- en Federale divisies. Voordat hij tot CEO werd benoemd, was hij Chief Operating Officer, waarbij hij de wereldwijde operaties en strategie leidde.
Met meer dan 20 jaar ervaring in technologie en telecommunicatie, hoe heeft uw carrièrepad uw aanpak beïnvloed om Appen te leiden door de snel evoluerende AI-landschap?
Mijn carrière begon als telecommunicatie-ingenieur, waar mijn rol was om netwerken te bouwen en te optimaliseren en waarbij een enorme hoeveelheid gegevens, analyses en het vinden van innovatieve oplossingen om netwerkprestaties en klantervaring te optimaliseren, betrokken waren.
Na het behalen van mijn MBA aan NYU, evolueerde dit naar leiderschapsrollen in technische strategie en fusies en overnames, waarbij ik me richtte op grotere strategische vragen, zoals opkomende trends, investeringsmogelijkheden en bedrijfsmodellen. Deze achtergrond heeft me een diepe kennis gegeven van zowel de technische als de bedrijfsaspecten van opkomende technologieën.
Bij Appen werken we op het snijvlak van AI en gegevens, en mijn ervaring heeft me in staat gesteld om het bedrijf te leiden en complexiteiten in de snel evoluerende AI-ruimte te navigeren, door belangrijke ontwikkelingen zoals spraakherkenning, NLP, aanbevelingssystemen en nu generatieve AI. Deze strategische visie is cruciaal omdat AI voortdurend industrieën wereldwijd transformeert.
U bent sinds 2018 bij Appen, waar u belangrijke overnames zoals Figure Eight en Quadrant heeft gedreven. Hoe hebben deze strategische moves Appen gepositioneerd als leider in AI-gegevensdiensten, en wat ziet u als de volgende grote kans voor het bedrijf?
De overnames van Figure Eight en Quadrant waren cruciaal voor het uitbreiden van onze AI-gegevensmogelijkheden, met name op het gebied van gegevensannotatie en geolocatie-intelligentie. Figure Eight’s gegevensannotatieplatform was bijzonder effectief. Het platform is zeer aanpasbaar en we hebben het gebruikt voor werk in veel verschillende domeinen. Onlangs hebben we het platform gebruikt om de meeste van onze generatieve AI-gegevensstromen uit te voeren.
Naast de overnames hebben we ongeveer 5 jaar geleden een operatie in China opgericht, genaamd Appen China. We zijn nu het grootste AI-gegevensbedrijf in China, met een omzet die bijna het dubbele is van die van onze naaste concurrenten.
Kijkend naar de toekomst ligt de focus voor Appen op het ondersteunen van de ontwikkeling en adoptie van generatieve AI. Er zijn grote groeimogelijkheden in zowel de modelbouwers als bedrijven die generatieve AI in hun producten en operaties willen integreren. We voelen dat we pas aan het begin staan van de grootste AI-golf.
Gegevenskwaliteit speelt een cruciale rol in de ontwikkeling van AI-modellen. Kunt u delen hoe Appen de nauwkeurigheid, diversiteit en relevantie van zijn gegevenssets waarborgt, met name met de toenemende vraag naar hoge kwaliteit LLM-trainingsgegevens?
Appen’s kracht ligt in onze mogelijkheid om consistent en op grote schaal hoge kwaliteit gegevens te creëren. We werken nauw samen met onze klanten om hun AI-modeldoelstellingen te begrijpen en ontwikkelen hoge kwaliteit gegevens voor hun behoeften via een multimultilayered aanpak die geautomatiseerde tools en menselijke feedback combineert. We hebben een wereldwijd werkforce van meer dan 1 miljoen over 200+ landen, waardoor we een groep gekwalificeerde en diverse bijdragers kunnen samenstellen. Door middel van strikte kwaliteitscontrole en feedbackloops waarborgen we dat de gegevens nauwkeurig, consistent en relevant zijn en kunnen worden gebruikt om de prestaties van AI-modellen effectief te verbeteren. Dit stelt AI-systemen in staat om effectief te functioneren in echte omgevingsomstandigheden en kan ook worden gebruikt om robuustheid te verbeteren en vooroordelen te verminderen, met name voor LLM’s.
Synthetische gegevens generatie wint aan populariteit, en Appen’s investering in Mindtech benadrukt uw interesse in dit gebied. Kunt u de voordelen en nadelen van het gebruik van synthetische of web-geëxtraheerde gegevens versus crowdsourced gegevens voor het trainen van AI-modellen bespreken, en hoe u synthetische gegevens ziet als aanvulling op de crowdsourced gegevens waar Appen bekend om staat?
Hoge kwaliteit gegevens zijn cruciaal maar kunnen duur en tijdrovend zijn om te produceren, waardoor synthetische gegevens aandacht krijgen. Het werkt goed voor gestructureerde gegevens in traditionele AI/ML-taken, met name in industrieën met strikte privacyregels zoals de gezondheidszorg en financiën, aangezien het het gebruik van persoonlijke informatie vermijdt.
Echter, synthetische gegevens ontbreken vaak aan diepte en nuances van echte wereldgegevens, met name voor complexe generatieve AI-taken die diversiteit en diepe expertise vereisen. Het kan ook fouten of vooroordelen uit de oorspronkelijke gegevens in stand houden. Web-geëxtraheerde gegevens, die vaak voor LLM’s worden gebruikt, stellen hun eigen uitdagingen voor met lage kwaliteit inhoud, vooroordelen en misinformatie, waardoor zorgvuldige curatie nodig is.
Crowdsourced gegevens, waar Appen zich op richt, blijven de “grondwaarheid”. Menselijke expertise is essentieel voor het genereren van diverse, complexe gegevens die nodig zijn om de nauwkeurigheid van AI-modellen te verbeteren en ervoor te zorgen dat ze in overeenstemming zijn met menselijke waarden.
We zien synthetische gegevens als aanvulling op onze door mensen geannoteerde gegevens. Terwijl synthetische gegevens sommige delen van het proces kunnen versnellen, waarborgen door mensen gelabelde gegevens dat modellen de diversiteit van de echte wereld weerspiegelen. Samen bieden ze een evenwichtige aanpak voor het creëren van hoge kwaliteit trainingsgegevens voor AI.
De EU AI Act en andere wereldwijde regelgeving vormen de ethische normen rond AI-ontwikkeling. Hoe ziet u deze regelgevingen de operaties van Appen en de bredere AI-industrie beïnvloeden in de toekomst?
De EU AI Act en soortgelijke wereldwijde regelgevingen zullen waarschijnlijk Appen’s operaties beïnvloeden door nieuwe ethische normen voor AI-modelontwikkeling en -prestaties in te stellen. We kunnen veranderingen zien in de manier waarop we gegevens behandelen, modelrechtvaardigheid waarborgen en ethische overwegingen aanpakken. Dit kan leiden tot meer rigoureuze processen en potentiële aanpassingen in onze aanpak van modeltraining en -validatie.
In bredere zin zullen deze regelgevingen de industrie naar hogere ethische normen leiden, de compliancekosten verhogen en mogelijk sommige aspecten van innovatie vertragen. Echter, ze zullen ook tot meer verantwoordelijkheid en transparantie leiden, wat uiteindelijk kan leiden tot meer verantwoorde en duurzame AI-ontwikkeling.
Met groeiende bezorgdheid over vooroordelen in AI, hoe werkt Appen om ervoor te zorgen dat de gegevenssets die worden gebruikt om AI-modellen te trainen, ethisch zijn geëxtraheerd en vrij van vooroordelen, met name in gevoelige gebieden zoals natuurlijke taalverwerking en computerzicht?
We werken actief aan het verminderen van vooroordelen door diversiteit en inclusie te bevorderen in al onze projecten. Het is bemoedigend om te zien dat veel van onze klanten zich richten op het vastleggen van brede demografieën in gegevensverzameling en modelbeoordelingstaken. Het hebben van een wereldwijd publiek dat in de meeste landen woont, stelt ons in staat om gegevens te verzamelen vanuit een breed scala aan perspectieven en ervaringen, wat met name belangrijk is in gevoelige gebieden zoals natuurlijke taalverwerking en computerzicht.
Sinds 2019 hebben we onze beste praktijken geformaliseerd in de Crowd Code of Ethics, waarin we onze toewijding aan diversiteit, eerlijkheid en crowd-welzijn laten zien. Dit omvat onze toezegging tot eerlijke betaling, ervoor zorgen dat de stem van onze crowd wordt gehoord en het handhaven van strikte privacybescherming. Door deze principes in stand te houden, streven we ernaar om hoge kwaliteit, ethisch geëxtraheerde gegevens te leveren die verantwoorde AI-ontwikkeling ondersteunen.
Terwijl AI meer geïntegreerd raakt in industrieën zoals automotive, advertising en AR/VR, hoe positioneert Appen zich om de toenemende vraag naar gespecialiseerde trainingsgegevens in deze sectoren te vervullen?
In de afgelopen 27 jaar hebben we gespecialiseerde trainingsgegevens geleverd voor een breed scala aan industrieën en use-cases, en we blijven evolueren naarmate de behoeften van onze klanten evolueren.
Als voorbeeld, in de automotive, werkten we samen met toonaangevende automotivebedrijven en in-cabineoplossingsproviders om in-vehicle spraaksystemen te bouwen. Nu helpen we onze klanten in nieuwe gebieden zoals video-gegevensverzameling van bestuurders om veiligheid te verbeteren door bestuurdersafleiding te monitoren.
In advertising hielpen we een toonaangevend wereldwijd advertentieplatform de kwaliteit en nauwkeurigheid van advertenties voor gebruikersrelevantie te verbeteren over een groot meerjarig wereldwijd programma met 7M+ beoordelingen. Nu, terwijl veel van deze platforms generatieve AI-oplossingen adopteren, helpen onze crowd niet alleen bij het beoordelen van de relevantie van advertenties, maar ook bij het evalueren van de kwaliteit van gegenereerde advertenties.
We zijn in staat geweest dit allemaal te doen via onze robuuste annotatieplatform dat kan worden aangepast om complexe workflows en verschillende gegevensmodaliteiten te ondersteunen, waaronder tekst, audio, afbeelding, video en multimodale annotatie. Maar uiteindelijk komt onze capaciteit om met de veranderende industrie mee te gaan neer op onze diepe expertise in gegevens voor AI-ontwikkeling en sterke partnerschap met onze klanten.
Appen is een leider geweest in het leveren van hoge kwaliteit gegevens voor een breed scala aan AI-toepassingen. Kijkend naar de toekomst, hoe ziet u de rol van Appen evolueren terwijl generatieve AI en LLM’s blijven ontwikkelen en wereldwijde markten beïnvloeden?
Generatieve AI en LLM’s transformeren industrieën, en we zullen blijven een cruciale rol spelen in het leveren van hoge kwaliteit gegevens om deze vooruitgang te ondersteunen. Wat betreft wereldwijde markten, zal onze capaciteit om te putten uit 200 landen en 500+ talen nog waardevoller worden, en we hebben een sterke geschiedenis hierin, aangezien we bedrijven zoals Microsoft hebben geholpen bij het lanceren van Machine Translation-modellen voor meer dan 110 talen.
Naarmate de implementatie van LLM-toepassingen groeit, zien we een groeiende vraag naar het in overeenstemming brengen met menselijke eindgebruikers, waaronder lokaliseringsmogelijkheden om ervoor te zorgen dat taal- en culturele nuances in verschillende wereldwijde markten worden aangepakt. We zijn toegewijd om bedrijven te helpen AI-systemen te ontwikkelen die zowel presteren als verantwoord zijn, door ervoor te zorgen dat de gegevens die worden gebruikt om deze modellen te trainen, divers, relevant en ethisch zijn geëxtraheerd.
Appen is bekend met het aandrijven van enkele van ‘s werelds meest geavanceerde LLM’s. Wat zijn enkele van de innovaties in gegevensannotatie en -verzameling waar Appen zich op richt om de prestaties van deze modellen te verbeteren?
We zijn voortdurend innovatief in onze gegevensannotatie- en -verzamelingprocessen om de prestaties van LLM’s te verbeteren. Een van de gebieden waarop we ons richten, is het verbeteren van de efficiëntie en nauwkeurigheid van gegevensannotatie via geavanceerde AI-ondersteunde tools, die helpen om delen van het proces te stroomlijnen en te automatiseren, terwijl hoge kwaliteitsnormen worden gehandhaafd.
We kunnen gegevenspunten identificeren die verdere menselijke input nodig hebben, waardoor annotatie-inspanningen gericht zijn waar ze het meeste impact zullen hebben. We hebben functies geïntegreerd in ons platform zoals Model Mate, die kunnen worden gebruikt om gegevensproductie te versnellen en gegevenskwaliteit te verbeteren. We zijn ook gefocust op beste praktijken in contributorbeheer, wat belangrijk is aangezien de complexiteit van taken toeneemt.
De mogelijkheid om contributor-prestaties te begrijpen en feedback te geven om de kwaliteit van onze door mensen gegenereerde gegevens voortdurend te verbeteren. Deze innovaties stellen ons in staat om hoge kwaliteit, grote hoeveelheden gegevens te leveren die nodig zijn om de wereldwijde toonaangevende LLM’s aan te drijven en te fijnstemmen.
Terwijl u de rol van CEO op uzelf neemt, wat zijn uw topprioriteiten voor Appen in de komende jaren, en hoe bent u van plan de groei van het bedrijf te stimuleren in de zeer concurrerende AI-ruimte?
Als ik de rol van CEO op mezelf neem, zijn mijn strategische prioriteiten ontworpen om Appen’s leiderschap in de concurrerende AI-landschap te waarborgen:
- Ondersteuning van de ontwikkeling van generatieve AI-modellen: In de afgelopen 18 maanden is generatieve AI een belangrijk onderdeel van onze dienstverlening geworden, met 28% van de groepsomzet afkomstig van generatieve AI-gerelateerde projecten in juni 2024, vergeleken met 8% in januari. We zien een aanzienlijk potentieel in de generatieve AI-markt, die naar verwachting 1,3 biljoen dollar zal bereiken in 2032, volgens industrievoorspellingen.
- Ondersteuning van de adoptie van generatieve AI-modellen: We zien groei in nieuwe segmenten terwijl ondernemingen generatieve AI-oplossingen voor hun use-cases gebruiken. Hoewel het percentage generatieve AI-projecten dat wordt geïmplementeerd laag is, verwachten we dat FY24/25 een overgangsperiode zal zijn waarin experimenten naar productie gaan, en vraag naar aangepaste hoge kwaliteit en gespecialiseerde gegevens zal stimuleren.
- Optimaliseren en automatiseren van de manier waarop we gegevens voorbereiden: Door het gebruik van AI voor kwaliteitsborging en het automatiseren van bepaalde stappen van het gegevensvoorbereidingsproces. Dit zal ons in staat stellen om de gegevenskwaliteit te verbeteren, terwijl we ook de operationele efficiëntie verbeteren, waardoor onze brutowinstmarges worden verbeterd.
- De ervaring van onze crowd-werkers evolueren: Ons nieuwe CrowdGen-platform stelt ons in staat om projecten snel en flexibel op te schalen in overeenstemming met de behoeften van onze klanten, met behulp van AI voor geautomatiseerd scherm en projectmatching. Dit zal ook de ervaring van onze contributors verbeteren met persoonlijke ondersteuning. Appen is een vroege aanhanger geweest in het bevorderen van transparantie, diversiteit en eerlijkheid in onze gegevensverzameling, en we blijven toegewijd aan onze Crowd Code of Ethics.
Deze prioriteiten zullen Appen positioneren voor duurzame groei en innovatie in de evoluerende AI-landschap.
Bedankt voor het geweldige interview, we moedigen lezers aan die meer willen leren om Appen te bezoeken.












