Intelligenza artificiale

Nuovi set di dati pronti all’uso (OTS) di Appen accelerano il deploy di AI

Published February 25, 2021

Updated April 5, 2026

Daniel Martin

Appen Limited (ASX:APX), il principale fornitore di dati di alta qualità per le organizzazioni che costruiscono sistemi di intelligenza artificiale (AI) efficaci su larga scala, ha annunciato oggi nuovi set di dati pronti all’uso (OTS). Questi set di dati sono progettati per rendere più facile e veloce per le aziende acquisire i dati di alta qualità necessari per accelerare i loro progetti di intelligenza artificiale (AI) e apprendimento automatico (ML). I nuovi set di dati OTS includono movimenti del corpo umano e suoni di pianto di bambini innovativi, nonché discorsi sceneggiati e immagini con testo adatti alla riconoscimento ottico dei caratteri (OCR) per lingue ad alta domanda ma difficili da acquisire, come arabo, croato, greco, ungherese, tailandese e molte altre. Con i set di dati ampliati, l’offerta totale di OTS di Appen include oltre 250 set di dati, composti da oltre 11.000 ore di audio, oltre 25.000 immagini e oltre 8,7 milioni di parole in 80 lingue e molti dialetti.

I set di dati OTS di Appen sono uno strumento veloce e conveniente per avviare un progetto di AI o ML con dati di alta qualità coerenti. Le squadre che ampliano le loro capacità di AI possono anche sfruttare i set di dati OTS per migliorare efficacemente l’accuratezza, sviluppare nuove competenze di modellazione e incorporare altri miglioramenti nei loro modelli di AI. Un set di dati OTS viene spesso consegnato in una settimana, ad esempio, rispetto alle 8-12 settimane per un nuovo progetto di raccolta e annotazione dei dati – o anche più a lungo, a seconda della complessità. Tutti i set di dati di Appen sono sviluppati utilizzando una metodologia completamente trasparente e opt-in, quindi gli specialisti di AI possono essere sicuri che i loro dati siano puliti e conformi, eliminando il potenziale rischio di reazioni negative e danni alla reputazione.

“Le squadre di AI in tutto il mondo che lavorano su progetti con scadenze strette e requisiti di dati flessibili possono trarre vantaggio dall’utilizzo di set di dati pronti all’uso”, ha dichiarato Wilson Pang, CTO di Appen. “I set di dati OTS riducono il tempo di valore e forniscono l’accesso ai dati di alta qualità a un costo totale inferiore rispetto ai metodi tradizionali. Noi di Appen prendiamo le necessarie misure per assicurarci che tutti i nostri set di dati siano eticamente fonte e bilanciati demograficamente, consentendo alle aziende di mantenere pratiche di AI responsabili minimizzando i pregiudizi nei loro modelli e garantendo un trattamento equo degli annotatori di dati. Si conosce sempre la precisa qualità di un set di dati OTS, il che aiuta a costruire un miglior AI che funziona nel mondo reale”.

MediaInterface ha fornito soluzioni tecnologiche linguistiche a istituzioni sanitarie in Germania e in altre parti dell’Europa per oltre 20 anni. Quando l’azienda si è espansa in Francia, aveva un software completamente localizzato, ma le mancavano i dati lessicali francesi, in particolare i nomi e i luoghi francesi, che vengono spesso citati nelle informazioni sulla salute dei pazienti. Utilizzando i set di dati OTS di Appen, MediaInterface ha acquisito circa 21.000 nomi francesi e 14.000 nomi di luoghi. “I dati critici di Appen sono stati incorporati nel nostro lessico di base per lanciare con successo in un nuovo mercato e ci aiutano a costruire nuovi vocabolari per i nostri clienti e a rafforzare il nostro approccio per i lanci di mercato futuri”, ha dichiarato Ines Wendler, product manager di MediaInterface.

Gli esperti di AI più esperti combinano i set di dati OTS con progetti di raccolta e annotazione dei dati su richiesta per soddisfare le esigenze complesse di formazione dei modelli di AI. Appen è il leader nell’offrire supporto continuo attraverso una gamma di servizi di raccolta dei dati specifici, come l’annotazione dei dati continua e l’etichettatura intelligente, attraverso strumenti e flussi di lavoro automatizzati per massimizzare l’efficienza.

“Interagiamo con l’AI dal momento in cui ci svegliamo al momento in cui andiamo a dormire – attraverso assistenti virtuali, chatbot, motori di ricerca, social network, dispositivi medici, auto intelligenti e altre applicazioni”, ha dichiarato Judith Bishop, senior director di Appen degli specialisti di AI, che guida un team di 100 linguisti e esperti di lingua. “La lingua è spesso l’interfaccia principale per molti di questi casi d’uso di AI convincenti, quindi per garantire una grande esperienza, il modello deve essere addestrato per funzionare per tutti. L’impegno di Appen per i dati di alta qualità e lo sviluppo di AI responsabile ed etico consente alle aziende che acquistano i nostri set di dati pronti all’uso di accelerare i loro progetti di AI con completa fiducia nei loro dati”.

Unite.AI

Nuovi set di dati pronti all’uso (OTS) di Appen accelerano il deploy di AI

You may like