Connect with us

Entrevistas

Ryan Kolln, CEO da Appen – Série de Entrevistas

mm

Ryan Kolln é o Diretor Executivo e Diretor Geral da Appen. Ryan traz mais de 20 anos de experiência global em tecnologia e telecomunicações, junto com uma profunda compreensão do negócio da Appen e da indústria de IA.

Sua carreira profissional começou como engenheiro, com foco em engenharia de dados de rede móvel na Austrália, Ásia e América do Norte. Após concluir um MBA na Universidade de Nova York, Ryan se juntou ao The Boston Consulting Group (BCG) em 2011 como consultor de estratégia. Durante seu tempo no BCG, ele se especializou em tecnologia e telecomunicações e adquiriu profunda expertise em estratégia em uma variedade de tópicos de crescimento e operacionais.

Ao se juntar à Appen AI em 2018 como VP de Desenvolvimento Corporativo, ele liderou aquisições estratégicas como Figure Eight e Quadrant, e apoiou o estabelecimento das divisões China e Federal. Antes de sua nomeação como CEO, ele atuou como Diretor Operacional, supervisionando operações e estratégia globais.

Com mais de 20 anos de experiência em tecnologia e telecomunicações, como sua carreira o ajudou a liderar a Appen através do cenário de IA em rápida evolução?
Minha carreira começou como engenheiro de telecomunicações, onde meu papel era construir e otimizar redes e envolvia uma enorme quantidade de dados, análise e encontrar soluções inovadoras para otimizar o desempenho da rede e a experiência do cliente.
Após concluir meu MBA na NYU, isso evoluiu para papéis de liderança em estratégia de tecnologia e fusões e aquisições, onde me concentrei em questões estratégicas maiores, como tendências emergentes, oportunidades de investimento e modelos de negócios. Essa formação me deu uma profunda compreensão de ambos os aspectos técnicos e de negócios das tecnologias emergentes.
Na Appen, trabalhamos na interseção de IA e dados, e minha experiência me permitiu liderar a empresa e navegar complexidades no espaço de IA em rápida evolução, passando por principais desenvolvimentos como reconhecimento de voz, NLP, sistemas de recomendação e agora IA gerativa. Essa visão estratégica é crucial à medida que a IA continua a transformar indústrias globalmente.
Você está na Appen desde 2018, impulsionando grandes aquisições como Figure Eight e Quadrant. Como essas movidas estratégicas posicionaram a Appen como líder em serviços de dados de IA, e o que você vê como a próxima grande oportunidade para a empresa?
As aquisições de Figure Eight e Quadrant foram fundamentais para expandir nossas capacidades de dados de IA, particularmente em áreas como anotação de dados e inteligência de geolocalização. A plataforma de anotação de dados da Figure Eight foi particularmente impactante. A plataforma é altamente personalizável, e a utilizamos para trabalhos em muitos domínios diferentes. Mais recentemente, temos utilizado a plataforma para executar a maioria de nossos fluxos de dados de IA gerativa.
Além das aquisições, cerca de 5 anos atrás, estabelecemos uma operação na China chamada Appen China. Agora somos a maior empresa de dados de IA na China, com receita quase duas vezes maior do que a de nossos concorrentes mais próximos.
Olhando para o futuro, o foco para a Appen é apoiar o desenvolvimento e a adoção de IA gerativa. Há oportunidades de crescimento significativas tanto para os construtores de modelos quanto para as empresas que buscam adotar IA gerativa em seus produtos e operações. Sentimos que estamos apenas no início da maior onda de IA.
A qualidade dos dados desempenha um papel crucial no desenvolvimento de modelos de IA. Você poderia compartilhar como a Appen garante a precisão, diversidade e relevância de seus conjuntos de dados, especialmente com a crescente demanda por dados de treinamento de LLM de alta qualidade?
A força da Appen é nossa capacidade de criar dados de alta qualidade consistentemente e em escala. Trabalhamos em estreita colaboração com nossos clientes para entender seus objetivos de modelo de IA e desenvolver dados de alta qualidade para suas necessidades por meio de uma abordagem em camadas que combina ferramentas automatizadas e feedback humano. Temos uma força de trabalho global de mais de 1 milhão em mais de 200 países, o que nos permite curar um grupo de colaboradores qualificados e diversificados. Através de rigoroso controle de qualidade e loops de feedback, garantimos que os dados sejam precisos, consistentes e relevantes, e possam ser usados para melhorar efetivamente o desempenho de modelos de IA. Isso permite que os sistemas de IA operem efetivamente em ambientes do mundo real e também podem ser usados para melhorar a robustez e reduzir o viés, especialmente para LLMs.
Geração de dados sintéticos está ganhando popularidade, e o investimento da Appen na Mindtech destaca seu interesse nessa área. Você poderia discutir as vantagens e desvantagens de usar dados sintéticos ou raspados da web versus dados crowdsourced para treinar modelos de IA, e como você vê os dados sintéticos complementando os dados crowdsourced que a Appen é conhecida?
­­Dados de alta qualidade são cruciais, mas podem ser caros e demorados para produzir, o que é por que os dados sintéticos estão ganhando atenção. Eles funcionam bem para dados estruturados em tarefas de IA/ML tradicionais, especialmente em setores com regulamentações de privacidade estritas como saúde e finanças, pois evitam o uso de informações pessoais.
No entanto, os dados sintéticos frequentemente carecem de profundidade e nuances de dados do mundo real, especialmente para tarefas de IA gerativa complexas que exigem diversidade e especialização profunda. Eles também podem perpetuar erros ou vieses dos dados originais. Os dados raspados da web, comumente usados para LLMs, apresentam seus próprios desafios com conteúdo de baixa qualidade, viés e desinformação, exigindo curadoria cuidadosa.
Os dados crowdsourced, nos quais a Appen se especializa, permanecem como a “verdade fundamental”. A especialização humana é vital para gerar dados diversificados e complexos necessários para melhorar a precisão do modelo de IA e garantir o alinhamento com os valores humanos.
Consideramos os dados sintéticos como complementares aos nossos dados anotados por humanos. Embora os dados sintéticos possam acelerar partes do processo, os dados rotulados por humanos garantem que os modelos refletem a diversidade do mundo real. Juntos, eles fornecem uma abordagem equilibrada para criar dados de treinamento de alta qualidade para IA.
O Ato de IA da UE e outras regulamentações globais estão moldando os padrões éticos em torno do desenvolvimento de IA. Como você vê essas regulamentações influenciando as operações da Appen e a indústria de IA mais ampla em frente?
O Ato de IA da UE e regulamentações globais semelhantes provavelmente influenciarão as operações da Appen, estabelecendo novos padrões éticos para o desenvolvimento e desempenho de modelos de IA. Podemos ver mudanças em como lidamos com dados, garantimos a justiça do modelo e abordamos considerações éticas. Isso pode levar a processos mais rigorosos e possíveis ajustes em nossa abordagem de treinamento e validação de modelos.
Mais amplamente, essas regulamentações provavelmente impulsionarão a indústria em direção a padrões éticos mais altos, aumentarão os custos de conformidade e potencialmente retardarão alguns aspectos da inovação. No entanto, elas também promoverão maior responsabilidade e transparência, o que pode levar a um desenvolvimento de IA mais responsável e sustentável.
Com crescentes preocupações em torno de vieses em IA, como a Appen trabalha para garantir que os conjuntos de dados usados para treinar modelos de IA sejam eticamente fontes e livres de vieses, particularmente em áreas sensíveis como processamento de linguagem natural e visão computacional?
Ativamente trabalhamos para reduzir os vieses, promovendo a diversidade e a inclusão em nossos projetos. É encorajador ver que muitos de nossos clientes estão focados em capturar demografia ampla na coleta de dados e tarefas de avaliação de modelos. Ter uma multidão global que reside na maioria dos países nos permite fonte de dados de uma ampla gama de perspectivas e experiências, o que é especialmente importante em áreas sensíveis como processamento de linguagem natural e visão computacional.
Desde 2019, formalizamos nossas melhores práticas no Código de Ética da Multidão, mostrando nosso compromisso com a diversidade, justiça e bem-estar da multidão. Isso inclui nosso compromisso com remuneração justa, garantindo que a voz de nossa multidão seja ouvida e mantendo estritas proteções de privacidade. Ao manter esses princípios, visamos fornecer dados de alta qualidade, eticamente fontes, que apoiem o desenvolvimento responsável de IA.
À medida que a IA se torna mais integrada a indústrias como automotiva, publicidade e AR/VR, como a Appen está se posicionando para atender à crescente demanda por dados de treinamento especializados nesses setores?
Ao longo dos últimos 27 anos, fornecemos dados de treinamento especializados para uma ampla gama de indústrias e casos de uso, e continuamos a evoluir à medida que as necessidades de nossos clientes evoluem.
Como exemplo, na automotiva, trabalhamos com empresas automotivas líderes e provedores de soluções de cabine para construir sistemas de fala dentro do veículo. Agora, estamos ajudando nossos clientes em novas áreas, como coleta de dados de vídeo de motoristas para ajudar na segurança, monitorando a distração do motorista.
Na publicidade, ajudamos uma plataforma de publicidade global a melhorar a qualidade e a precisão dos anúncios para a relevância do usuário durante um grande programa global de vários anos com 7M+ avaliações. Agora, à medida que muitas das plataformas adotam soluções de IA gerativa, nossa multidão não apenas avalia a relevância dos anúncios, mas também ajuda a avaliar a qualidade dos anúncios gerados.
Fomos capazes de fazer tudo isso por meio de nossa robusta plataforma de anotação, que pode ser personalizada para suportar fluxos de trabalho complexos e várias modalidades de dados, incluindo texto, áudio, imagem, vídeo e anotação multimodal. Mas, em última análise, nossa capacidade de nos movermos com a mudança da indústria vem de nossa profunda especialização em dados para desenvolvimento de IA e forte parceria com nossos clientes.
A Appen tem sido líder em fornecer dados de alta qualidade para uma variedade de aplicações de IA. Olhando para o futuro, como você vê o papel da Appen evoluindo à medida que a IA gerativa e os LLMs continuam a se desenvolver e influenciar mercados globais?
A IA gerativa e os LLMs estão transformando indústrias, e continuaremos a desempenhar um papel crítico ao fornecer dados de alta qualidade para apoiar esses avanços. Quando se trata de mercados globais, nossa capacidade de fonte em mais de 200 países e 500+ idiomas se tornará ainda mais valiosa, e temos uma forte história disso, pois ajudamos empresas como a Microsoft a lançar modelos de tradução automática para mais de 110 idiomas.
À medida que o deploy de aplicações de LLM cresce, vemos uma demanda crescente por alinhamento com usuários finais humanos, incluindo capacidades de localização para garantir que nuances de idioma e cultura sejam abordadas em vários mercados globais. Estamos comprometidos em ajudar as empresas a desenvolver sistemas de IA que sejam tanto performáticos quanto responsáveis, garantindo que os dados usados para treinar esses modelos sejam diversificados, relevantes e eticamente fontes.
A Appen é conhecida por alimentar alguns dos LLMs mais avançados do mundo. Quais são algumas das inovações em anotação e coleta de dados que a Appen está se concentrando para melhorar o desempenho desses modelos?
Estamos continuamente inovando nossos processos de anotação e coleta de dados para melhorar o desempenho dos LLMs. Uma área de foco é melhorar a eficiência e a precisão da anotação de dados por meio de ferramentas de IA assistida avançadas, que ajudam a simplificar e automatizar partes do processo, mantendo os padrões de alta qualidade.
Podemos identificar pontos de dados que necessitam de entrada humana adicional, garantindo que os esforços de anotação sejam direcionados onde terão o maior impacto. Temos recursos integrados em nossa plataforma, como o Model Mate, que pode ser usado para ajudar a acelerar a produção de dados e melhorar a qualidade dos dados. Também estamos focados nas melhores práticas de gerenciamento de colaboradores, o que é importante à medida que a complexidade das tarefas aumenta.
A capacidade de entender o desempenho do colaborador e fornecer feedback para continuamente melhorar a qualidade de nossos dados gerados por humanos. Essas inovações nos permitem fornecer dados de alta qualidade e em grande escala necessários para alimentar e ajustar os LLMs líderes do mundo.
À medida que você assume seu novo papel como CEO, quais são suas principais prioridades para a Appen nos próximos anos, e como você planeja impulsionar o crescimento da empresa no competitivo espaço de IA?
À medida que transito para o papel de CEO, minhas prioridades estratégicas são projetadas para garantir a liderança da Appen no competitivo cenário de IA:

  • Apoiar o desenvolvimento de modelos de IA gerativa: Nos últimos 18 meses, a IA gerativa se tornou um componente-chave de nossa oferta de serviços, com 28% da receita do grupo vindo de projetos relacionados à IA gerativa em junho de 2024, em comparação com 8% em janeiro. Vemos um potencial significativo no mercado de IA gerativa, que deve atingir $1,3 trilhão até 2032, de acordo com previsões da indústria.
  • Apoiar a adoção de modelos de IA gerativa: Vemos crescimento em novos segmentos à medida que as empresas aproveitam soluções de IA gerativa para seus casos de uso. Embora a porcentagem de projetos de IA gerativa que atingem a implantação seja baixa, antecipamos que o FY24/25 será um período de transição, onde experimentos se movem para a produção e impulsionam a demanda por dados personalizados de alta qualidade e especializados.
  • Otimizar e automatizar a forma como preparamos os dados: Utilizando a IA para garantia de qualidade e automatizando certas etapas do processo de preparação de dados. Isso nos permitirá melhorar a qualidade dos dados, ao mesmo tempo em que melhoramos a eficiência operacional, melhorando nossas margens brutas.
  • Evoluir a experiência para nossos trabalhadores da multidão: Nossa nova plataforma CrowdGen permite que escalamos projetos rapidamente e de forma flexível, alinhados com as necessidades de nossos clientes, utilizando a IA para triagem automática e correspondência de projetos. Isso também melhorará a experiência do colaborador com suporte personalizado. A Appen tem sido uma das primeiras a promover transparência, diversidade e justiça em nossa fonte de dados, e permanecemos comprometidos com nosso Código de Ética da Multidão.

Essas prioridades posicionarão a Appen para um crescimento sustentado e inovação no cenário de IA em evolução.
Obrigado pela grande entrevista, incentivamos os leitores que desejam aprender mais a visitar Appen.

Antoine é um líder visionário e sócio-fundador da Unite.AI, impulsionado por uma paixão inabalável em moldar e promover o futuro da IA e da robótica. Um empreendedor serial, ele acredita que a IA será tão disruptiva para a sociedade quanto a eletricidade, e é frequentemente pego falando sobre o potencial das tecnologias disruptivas e da AGI. Como um futurista, ele está dedicado a explorar como essas inovações moldarão nosso mundo. Além disso, ele é o fundador da Securities.io, uma plataforma focada em investir em tecnologias de ponta que estão redefinindo o futuro e remodelando setores inteiros.