Interviste
Ryan Kolln, CEO at Appen – Interview Series

Ryan Kolln è il Chief Executive Officer e Managing Director di Appen. Ryan porta con sé oltre 20 anni di esperienza globale nel settore tecnologico e delle telecomunicazioni, insieme a una profonda comprensione del business di Appen e dell’industria dell’AI.
La sua carriera professionale è iniziata come ingegnere, con un focus sull’ingegneria dei dati delle reti mobili in Australia, Asia e Nord America. Al termine di un MBA alla New York University, Ryan si è unito a The Boston Consulting Group (BCG) nel 2011 come consulente strategico. Durante il suo tempo alla BCG, si è specializzato in tecnologia e telecomunicazioni e ha acquisito una profonda esperienza strategica in una varietà di argomenti di crescita e operativi.
Unendosi ad Appen AI nel 2018 come VP di Corporate Development, ha guidato acquisizioni strategiche come Figure Eight e Quadrant, e ha supportato l’istituzione delle divisioni China e Federal. Prima della sua nomina a CEO, ha ricoperto il ruolo di Chief Operating Officer, sovraintendendo alle operazioni e alla strategia globali.
Con oltre 20 anni di esperienza nel settore tecnologico e delle telecomunicazioni, come ha influenzato la sua carriera il suo approccio alla guida di Appen nel rapidamente evolversi paesaggio dell’AI?
La mia carriera è iniziata come ingegnere delle telecomunicazioni, dove il mio ruolo era quello di costruire e ottimizzare le reti e coinvolgeva una grande quantità di dati, analisi e trovare soluzioni innovative per ottimizzare le prestazioni della rete e l’esperienza del cliente.
Dopo aver completato il mio MBA alla NYU, questo si è evoluto in ruoli di leadership nella strategia tecnologica e nelle fusioni e acquisizioni, dove mi sono concentrato su questioni strategiche più ampie, come tendenze emergenti, opportunità di investimento e modelli di business. Questo background mi ha dato una profonda comprensione sia degli aspetti tecnici che di business delle tecnologie emergenti.
In Appen, lavoriamo all’intersezione dell’AI e dei dati, e la mia esperienza mi ha permesso di guidare l’azienda e navigare le complessità nello spazio dell’AI in rapida evoluzione, muovendomi attraverso importanti sviluppi come il riconoscimento vocale, NLP, sistemi di raccomandazione e ora AI generativa. Questa visione strategica è cruciale poiché l’AI continua a trasformare le industrie a livello globale.
È stato con Appen dal 2018, guidando importanti acquisizioni come Figure Eight e Quadrant. Come hanno posizionato queste mosse strategiche Appen come leader nei servizi di dati per l’AI, e cosa vede come la prossima grande opportunità per l’azienda?
Le acquisizioni di Figure Eight e Quadrant sono state fondamentali per espandere le nostre capacità di dati per l’AI, in particolare in aree come l’annotazione dei dati e l’intelligenza geolocazionale. La piattaforma di annotazione dei dati di Figure Eight è stata particolarmente impattante. La piattaforma è altamente personalizzabile e l’abbiamo utilizzata per lavori in molti domini diversi. Più recentemente, l’abbiamo utilizzata per eseguire la maggior parte dei nostri flussi di dati di AI generativa.
In aggiunta alle acquisizioni, circa 5 anni fa abbiamo istituito un’operazione in Cina chiamata Appen Cina. Siamo ora la più grande azienda di dati per l’AI in Cina, con ricavi quasi doppi rispetto ai nostri competitor più vicini.
Guardando avanti, l’attenzione per Appen è quella di supportare lo sviluppo e l’adozione dell’AI generativa. Ci sono grandi opportunità di crescita sia per i costruttori di modelli che per le aziende che cercano di adottare l’AI generativa nei loro prodotti e operazioni. Sentiamo di essere solo all’inizio della più grande ondata di AI.
La qualità dei dati gioca un ruolo cruciale nello sviluppo dei modelli di AI. Potrebbe condividere come Appen assicura l’accuratezza, la diversità e la rilevanza dei suoi set di dati, in particolare con la crescente domanda di dati di addestramento di alta qualità per LLM?
La forza di Appen è la nostra capacità di creare dati di alta qualità in modo coerente e su larga scala. Lavoriamo a stretto contatto con i nostri clienti per comprendere gli obiettivi dei loro modelli di AI e sviluppare dati di alta qualità per le loro esigenze attraverso un approccio multilivello che combina strumenti automatizzati e feedback umano. Abbiamo una forza lavoro globale di oltre 1 milione in più di 200 paesi, il che ci consente di curare un gruppo di contributori qualificati e diversificati. Attraverso rigorosi controlli di qualità e feedback, assicuriamo che i dati siano accurati, coerenti e rilevanti, e possano essere utilizzati per migliorare efficacemente le prestazioni dei modelli di AI. Ciò consente ai sistemi di AI di operare efficacemente in ambienti del mondo reale e può anche essere utilizzato per migliorare la robustezza e ridurre il bias, in particolare per LLM.
Dati sintetici generazione sta guadagnando popolarità, e l’investimento di Appen in Mindtech evidenzia il suo interesse in questo settore. Potrebbe discutere i vantaggi e gli svantaggi dell’utilizzo di dati sintetici o web-scraped rispetto ai dati crowdsourced per l’addestramento dei modelli di AI, e come vede i dati sintetici complementare ai dati crowdsourced per cui Appen è nota?
I dati di alta qualità sono cruciali ma possono essere costosi e richiedere molto tempo per essere prodotti, ed è per questo che i dati sintetici stanno guadagnando attenzione. Funzionano bene per i dati strutturati nei compiti tradizionali di AI/ML, in particolare in settori con rigide norme di privacy come sanità e finanza, poiché evitano l’uso di informazioni personali.
Tuttavia, i dati sintetici spesso mancano della profondità e della sfumatura dei dati del mondo reale, in particolare per compiti di AI generativa complessi che richiedono diversità e profonda esperienza. Possono anche perpetuare errori o bias dai dati originali. I dati web-scraped, comunemente utilizzati per LLM, presentano le loro sfide con contenuti di bassa qualità, bias e disinformazione, richiedendo una cura attenta.
I dati crowdsourced, in cui Appen si specializza, rimangono la “verità di base”. L’esperienza umana è vitale per generare dati diversificati e complessi necessari per migliorare l’accuratezza dei modelli di AI e assicurare l’allineamento con i valori umani.
Consideriamo i dati sintetici come complementari ai nostri dati annotati da esseri umani. Mentre i dati sintetici possono accelerare alcune parti del processo, i dati etichettati da esseri umani assicurano che i modelli riflettano la diversità del mondo reale. Insieme, forniscono un approccio equilibrato per creare dati di addestramento di alta qualità per l’AI.
L’Atto dell’AI dell’UE e altre norme globali stanno plasmando gli standard etici intorno allo sviluppo dell’AI. Come vede queste norme che influenzano le operazioni di Appen e l’industria dell’AI più ampia in futuro?
L’Atto dell’AI dell’UE e norme simili a livello globale probabilmente influenzeranno le operazioni di Appen stabilendo nuovi standard etici per lo sviluppo e le prestazioni dei modelli di AI. Potremmo vedere cambiamenti nel modo in cui gestiamo i dati, assicuriamo la correttezza del modello e affrontiamo considerazioni etiche. Ciò potrebbe portare a processi più rigorosi e potenziali aggiustamenti nel nostro approccio all’addestramento e convalida del modello.
In generale, queste norme probabilmente guideranno l’industria verso standard etici più alti, aumenteranno i costi di conformità e potrebbero rallentare alcuni aspetti dell’innovazione. Tuttavia, porteranno anche a una maggiore responsabilità e trasparenza, il che potrebbe alla fine portare a uno sviluppo dell’AI più responsabile e sostenibile.
Con crescenti preoccupazioni intorno al bias nell’AI, come lavora Appen per assicurare che i set di dati utilizzati per addestrare i modelli di AI siano eticamente fonte e liberi da bias, in particolare in aree sensibili come l’elaborazione del linguaggio naturale e la visione artificiale?
Lavoriamo attivamente per ridurre il bias promuovendo la diversità e l’inclusione in tutti i nostri progetti. È incoraggiante vedere che molti dei nostri clienti si concentrano sulla cattura di ampie demografie nella raccolta dei dati e nelle attività di valutazione dei modelli. Avere una folla globale che risiede nella maggior parte dei paesi ci consente di raccogliere dati da una vasta gamma di prospettive ed esperienze, il che è particolarmente importante in aree sensibili come l’elaborazione del linguaggio naturale e la visione artificiale.
Dal 2019, abbiamo formalizzato le nostre migliori pratiche nel Crowd Code of Ethics, mostrando il nostro impegno verso la diversità, la correttezza e il benessere della folla. Ciò include il nostro impegno per un pagamento equo, assicurando che la voce della nostra folla sia ascoltata e mantenendo rigorose protezioni della privacy. Sostenendo questi principi, ci proponiamo di fornire dati di alta qualità, eticamente fonte, che supportino lo sviluppo responsabile dell’AI.
Man mano che l’AI si integra maggiormente in settori come l’automobilistico, la pubblicità e la realtà aumentata/virtuale, come si sta posizionando Appen per soddisfare la crescente domanda di dati di addestramento specializzati in questi settori?
Negli ultimi 27 anni, abbiamo fornito dati di addestramento specializzati per una vasta gamma di settori e casi d’uso, e continuiamo a evolverci man mano che evolvono le esigenze dei nostri clienti.
Ad esempio, nel settore automobilistico, abbiamo lavorato con importanti aziende automobilistiche e fornitori di soluzioni per l’abitacolo per costruire sistemi di parlato in veicolo. Ora, stiamo aiutando i nostri clienti in nuove aree come la raccolta di dati video dei conducenti per aiutare la sicurezza monitorando la distrazione del conducente.
Nel settore della pubblicità, abbiamo aiutato una piattaforma pubblicitaria globale a migliorare la qualità e l’accuratezza degli annunci per la rilevanza degli utenti su un ampio programma globale pluriennale con oltre 7 milioni di valutazioni. Ora, poiché molte di queste piattaforme stanno adottando soluzioni di AI generativa, i nostri contributori non solo valutano la rilevanza degli annunci, ma aiutano anche a valutare la qualità degli annunci generati.
Siamo stati in grado di fare tutto ciò attraverso la nostra piattaforma di annotazione robusta, che può essere personalizzata per supportare flussi di lavoro complessi e vari modalità di dati, tra cui testo, audio, immagine, video e annotazione multimodale. Ma alla fine, la nostra capacità di muoverci con l’evoluzione del settore dipende dalla nostra profonda esperienza nei dati per lo sviluppo dell’AI e da una forte partnership con i nostri clienti.
Appen è stata un leader nel fornire dati di alta qualità per una varietà di applicazioni di AI. Guardando avanti, come vede l’evoluzione del ruolo di Appen man mano che l’AI generativa e i LLM continuano a svilupparsi e influenzare i mercati globali?
L’AI generativa e i LLM stanno trasformando le industrie, e continueremo a svolgere un ruolo critico nel fornire dati di alta qualità per supportare questi progressi. Quando si tratta di mercati globali, la nostra capacità di raccogliere dati in oltre 200 paesi e 500 lingue diventerà ancora più preziosa, e abbiamo una solida storia in questo, poiché abbiamo aiutato aziende come Microsoft a lanciare modelli di traduzione automatica per oltre 110 lingue.
Man mano che la distribuzione delle applicazioni LLM cresce, vediamo una crescente domanda di allineamento con gli utenti finali umani, inclusa la capacità di localizzazione per assicurare che le sfumature linguistiche e culturali siano affrontate nei vari mercati globali. Siamo impegnati ad aiutare le aziende a sviluppare sistemi di AI che siano sia performanti che responsabili, assicurando che i dati utilizzati per addestrare questi modelli siano diversificati, rilevanti ed eticamente fonte.
Appen è nota per alimentare alcuni dei LLM più avanzati del mondo. Quali sono alcune delle innovazioni nell’annotazione e raccolta dei dati su cui Appen si concentra per migliorare le prestazioni di questi modelli?
Stiamo continuamente innovando i nostri processi di annotazione e raccolta dei dati per migliorare le prestazioni dei LLM. Un’area di focus è il miglioramento dell’efficienza e dell’accuratezza dell’annotazione dei dati attraverso strumenti AI-assisted avanzati, che aiutano a razionalizzare e automatizzare parti del processo, mantenendo allo stesso tempo gli standard di alta qualità.
Possiamo identificare i punti di dati che richiedono ulteriore input umano, assicurando che gli sforzi di annotazione siano mirati dove avranno il maggior impatto. Abbiamo integrato funzionalità nella nostra piattaforma come Model Mate, che può essere utilizzata per aiutare ad accelerare la produzione di dati e migliorare la qualità dei dati. Siamo anche concentrati sulle migliori pratiche nella gestione dei contributori, il che è importante poiché la complessità dei compiti aumenta.
La capacità di comprendere le prestazioni a livello di contributore e fornire feedback per migliorare continuamente la qualità dei nostri dati generati da esseri umani. Queste innovazioni ci consentono di fornire dati di alta qualità e su larga scala necessari per alimentare e perfezionare i LLM leader nel mondo.
Man mano che si insedia nel suo nuovo ruolo di CEO, quali sono le sue priorità principali per Appen nei prossimi anni, e come pianifica di guidare la crescita dell’azienda in uno spazio AI altamente competitivo?
Man mano che mi trasferisco nel ruolo di CEO, le mie priorità strategiche sono progettate per assicurare la leadership di Appen nel competitivo panorama dell’AI:
- Supportare lo sviluppo di modelli di AI generativa: Negli ultimi 18 mesi, l’AI generativa è diventata un componente chiave della nostra offerta di servizi, con il 28% del fatturato del gruppo proveniente da progetti di AI generativa nel giugno 2024 rispetto all’8% a gennaio. Vediamo un grande potenziale nel mercato dell’AI generativa, che dovrebbe raggiungere 1,3 trilioni di dollari entro il 2032 secondo le previsioni del settore.
- Supportare l’adozione di modelli di AI generativa: Vediamo una crescita in nuovi segmenti man mano che le aziende adottano soluzioni di AI generativa per i loro casi d’uso. Sebbene la percentuale di progetti di AI generativa che raggiungono la fase di deploy sia bassa, anticipiamo che il FY24/25 sarà un periodo di transizione in cui gli esperimenti si spostano verso la produzione e guidano la domanda di dati personalizzati e specializzati.
- Ottimizzare e automatizzare il modo in cui prepariamo i dati: Utilizzando l’AI per il controllo di qualità e automatizzando alcune fasi del processo di preparazione dei dati. Ciò ci consentirà di migliorare la qualità dei dati e migliorare al contempo l’efficienza operativa, migliorando i nostri margini lordi.
- Evoluzione dell’esperienza per i nostri lavoratori della folla: La nostra nuova piattaforma CrowdGen ci consente di scalare progetti in modo rapido e flessibile in linea con le esigenze dei nostri clienti, utilizzando l’AI per la selezione automatizzata e l’abbinamento dei progetti. Ciò migliorerà anche l’esperienza del contributore con supporto personalizzato. Appen è stata un’early adopter nella promozione della trasparenza, della diversità e della correttezza nella raccolta dei dati, e rimaniamo impegnati nel nostro Crowd Code of Ethics.
Queste priorità posizioneranno Appen per una crescita sostenibile e innovazione nel panorama dell’AI in evoluzione.
Grazie per la grande intervista, invitiamo i lettori che desiderano saperne di più a visitare Appen.












