Connect with us

Inteligência artificial

Novos Conjuntos de Dados Prontos para Uso (OTS) da Appen Aceleram a Implantação de IA

mm

Appen Limited (ASX:APX), o principal fornecedor de dados de treinamento de alta qualidade para organizações que constroem sistemas de IA eficazes em escala, anunciou hoje novos conjuntos de dados prontos para uso (OTS). Esses conjuntos de dados são projetados para tornar mais fácil e rápido para as empresas adquirir os dados de treinamento de alta qualidade necessários para acelerar seus projetos de inteligência artificial (IA) e aprendizado de máquina (ML). Os novos conjuntos de dados OTS incluem movimento do corpo humano e sons inovadores de choro de bebê, bem como discurso escrito e imagens com texto adequados para reconhecimento óptico de caracteres (OCR) para idiomas de alta demanda, mas difíceis de adquirir, como árabe, croata, grego, húngaro, tailandês e mais. Com os conjuntos de dados expandidos, a oferta total de OTS da Appen inclui mais de 250 conjuntos de dados, compreendendo mais de 11.000 horas de áudio, mais de 25.000 imagens e mais de 8,7 milhões de palavras em 80 idiomas e vários dialetos.

Os conjuntos de dados OTS da Appen são uma ferramenta rápida e econômica para iniciar um projeto de IA ou ML com dados de treinamento de alta qualidade consistentes. As equipes que expandem suas capacidades de IA também podem aproveitar os conjuntos de dados OTS para melhorar efetivamente a precisão, desenvolver novas habilidades de modelo e incorporar outras melhorias em seus modelos de IA. Um conjunto de dados OTS é frequentemente entregue em uma semana, por exemplo, em comparação com as oito a doze semanas para um novo projeto de coleta e anotação de dados – ou mesmo mais, dependendo da complexidade. Todos os conjuntos de dados da Appen são desenvolvidos usando uma metodologia totalmente transparente e opt-in, para que os especialistas em IA possam ter certeza de que seus dados são limpos e conformes, eliminando o risco potencial de reações adversas e danos à reputação.

“Equipes de IA em todo o mundo que trabalham em projetos com prazos apertados e requisitos de dados flexíveis podem se beneficiar do uso de conjuntos de dados prontos para uso”, disse Wilson Pang, CTO da Appen. “Os conjuntos de dados OTS encurtam o tempo de valor e fornecem acesso a dados de alta qualidade a um custo total mais baixo do que os métodos tradicionais. Nós, na Appen, damos os passos necessários para garantir que todos os nossos conjuntos de dados sejam eticamente-fonte e demograficamente equilibrados, permitindo que as empresas mantenham práticas de IA responsáveis, minimizando o viés em seus modelos e garantindo o tratamento justo dos anotadores de dados. Você sempre sabe a qualidade exata de um conjunto de dados OTS, o que ajuda a construir uma IA melhor que funciona no mundo real.”

A MediaInterface entregou soluções de tecnologia de linguagem para instituições de saúde na Alemanha e em outras partes da Europa por mais de 20 anos. Quando a empresa estava expandindo para a França, ela tinha software totalmente localizado, mas faltava dados léxicos em francês, especialmente nomes e lugares em francês, que são frequentemente referenciados em informações de saúde do paciente. Usando os conjuntos de dados OTS da Appen, a MediaInterface adquiriu aproximadamente 21.000 nomes em francês e 14.000 nomes de lugares. “Os dados críticos da Appen foram incorporados ao nosso léxico de fundo para lançar com sucesso em um novo mercado, e isso nos ajuda a construir novos vocabulários para nossos clientes e fortalecer nossa abordagem para futuros lançamentos de mercado”, disse Ines Wendler, gerente de produto da MediaInterface.

Os especialistas em IA mais experientes combinam conjuntos de dados OTS com projetos de coleta e anotação de dados sob demanda para atender às necessidades complexas de treinamento de dados de modelo de IA. A Appen é a líder em oferecer suporte contínuo por meio de uma gama de serviços de coleta de dados específicos, como anotação de dados contínua e marcação inteligente, por meio de ferramentas e fluxos de trabalho automatizados para maximizar a eficiência.

“Nós interagimos com a IA desde o momento em que acordamos até o momento em que dormimos – por meio de assistentes virtuais, chatbots, motores de busca, redes sociais, dispositivos médicos, carros inteligentes e outras aplicações”, disse Judith Bishop, diretora sênior de especialistas em IA da Appen, que lidera uma equipe de 100 linguistas e especialistas em linguagem. “A linguagem é frequentemente a interface principal para muitos desses casos de uso de IA atraentes, então para garantir uma experiência ótima, o modelo precisa ser treinado para funcionar para todos. O compromisso da Appen com dados de alta qualidade e desenvolvimento de IA ético e responsável permite que as empresas que compram nossos conjuntos de dados prontos para uso acelerem seus projetos de IA com total confiança em seus dados.”

Juntando-se aos centenas de conjuntos de dados já disponíveis no appen.com, a lista de novos conjuntos de dados OTS da Appen que agora estão disponíveis inclui:

  • Discurso escrito para árabe (Egito), árabe (Arábia Saudita), árabe (Emirados Árabes Unidos), khmer central (Camboja), croata, grego, húngaro, polonês, espanhol (Espanha) e turco
  • OCR de imagem para texto impresso em chinês simplificado, texto impresso em tailandês e texto impresso em finlandês – Inclui outdoors, embalagens, sinais, revistas e menus pré-gravados para treinar e atualizar modelos de OCR de visão computacional
  • Movimento do corpo humano (China) – Inclui vídeos anotados de pessoas se movendo, rastreados em nível de pixel, adequados para desenvolvimento de jogos, aplicativos de fitness e mais
  • Áudio de choro de bebê (China) – Inclui sons de bebê pré-gravados e anotados que podem ser usados para treinar modelos de IA para reconhecer diferentes sons de choro e alertar os pais

Para obter mais informações e solicitar uma amostra de conjunto de dados OTS da Appen, clique aqui.

Daniel é um grande defensor de como a IA eventualmente disruptará tudo. Ele respira tecnologia e vive para experimentar novos gadgets.