Inteligență artificială
Noi Seturi de Date Gata de Folosit (OTS) de la Appen Accelerează Implementarea IA

Appen Limited (ASX:APX), principalul furnizor de date de antrenare de înaltă calitate pentru organizațiile care construiesc sisteme AI eficiente la scară largă, a anunțat astăzi noi seturi de date gata de folosit (OTS). Aceste seturi de date sunt proiectate pentru a face mai ușor și mai rapid pentru întreprinderi să achiziționeze datele de antrenare de înaltă calitate necesare pentru a accelera proiectele lor de inteligență artificială (IA) și învățare automată (ML). Noile seturi de date OTS includ mișcări ale corpului uman și sunete inovatoare de plâns de bebeluși, precum și discursuri scrise și imagini cu text potrivite pentru recunoașterea optică a caracterelor (OCR) pentru limbi cu cerere ridicată, dar greu de achiziționat, cum ar fi arabă, croată, greacă, maghiară, thailandeză și multe altele. Cu seturile de date extinse, oferta totală OTS a Appen include peste 250 de seturi de date, cuprinzând peste 11.000 de ore de audio, peste 25.000 de imagini și peste 8,7 milioane de cuvinte în 80 de limbi și multiple dialecte.
Seturile de date OTS ale Appen sunt un instrument rapid și rentabil pentru a demara un proiect IA sau ML cu date de antrenare de înaltă calitate și consistență. Echipele care își extind capacitățile IA pot, de asemenea, să utilizeze seturile de date OTS pentru a îmbunătăți eficient acuratețea, a dezvolta noi abilități de model și a incorpora alte îmbunătățiri în modelele lor IA. Un set de date OTS este adesea livrat într-o săptămână, de exemplu, comparativ cu opt până la doisprezece săptămâni pentru un proiect de colectare și anotare a datelor nou – sau chiar mai mult, în funcție de complexitate. Toate seturile de date Appen sunt dezvoltate utilizând o metodologie complet transparentă și opțională, astfel încât specialiștii IA pot fi siguri că datele lor sunt curate și conforme, eliminând posibilitatea unui răspuns negativ și a deteriorării reputației.
“Echipele de IA din întreaga lume care lucrează la proiecte cu termene limită strânse și cerințe de date flexibile pot beneficia de utilizarea seturilor de date gata de folosit”, a declarat Wilson Pang, CTO al Appen. “Seturile de date OTS scurtează timpul până la valoare și oferă acces la date de înaltă calitate la un cost total mai mic decât utilizarea metodelor tradiționale. Noi, la Appen, luăm măsurile necesare pentru a ne asigura că toate seturile noastre de date sunt surse etice și echilibrate demografic, permițând companiilor să mențină practici responsabile de IA prin minimizarea bias-ului în modelele lor și asigurarea unui tratament echitabil al annotatorilor de date. Aveți întotdeauna cunoștința exactă a calității unui set de date OTS, ceea ce ajută la crearea unui IA mai bun care funcționează în lumea reală.”
MediaInterface a livrat soluții de tehnologie a limbajului pentru instituții de sănătate din Germania și alte părți ale Europei de peste 20 de ani. Când compania s-a extins în Franța, a avut software complet localizat, dar a lipsit datele lexicale franceze, în special numele și locurile franceze, care sunt adesea referite în informațiile despre sănătatea pacienților. Utilizând seturile de date OTS Appen, MediaInterface a achiziționat aproximativ 21.000 de nume franceze și 14.000 de nume de locuri. “Datele critice de la Appen au fost incorporate în lexiconul nostru de fond pentru a lansa cu succes pe o piață nouă, și acest lucru ne ajută să construim vocabulare noi pentru clienții noștri și să consolidăm abordarea noastră pentru lansări viitoare de piață”, a declarat Ines Wendler, manager de produs la MediaInterface.
Cei mai experimentați experți IA combină seturile de date OTS cu proiecte de colectare și anotare a datelor la cerere pentru a-și satisface nevoile complexe de date de antrenare pentru modelele IA. Appen este lider în oferirea de suport continuu prin intermediul unei game de servicii de colectare a datelor specifice, cum ar fi anotarea continuă a datelor și etichetarea inteligentă, prin instrumente și fluxuri de lucru automatizate pentru a maximiza eficiența.
“Interacționăm cu IA de la momentul trezirii până la momentul culcării – prin asistenți virtuali, chatbot-uri, motoare de căutare, rețele sociale, dispozitive medicale, mașini inteligente și alte aplicații”, a declarat Judith Bishop, director senior al specialiștilor IA de la Appen, care conduce o echipă de 100 de lingviști și experți în limbaj. “Limbajul este adesea interfața principală pentru multe dintre aceste cazuri de utilizare IA convingătoare, astfel încât pentru a garanta o experiență excelentă, modelul trebuie să fie antrenat pentru a funcționa pentru toată lumea. Angajamentul Appen față de date de înaltă calitate și dezvoltarea IA responsabilă și etică permite companiilor care cumpără seturile noastre de date gata de folosit să-și accelereze proiectele IA cu încredere deplină în datele lor.”
În lista existentă de sute de seturi de date care sunt deja live pe appen.com, noua listă de seturi de date OTS Appen care sunt acum disponibile include:
- Discursuri scrise pentru arabă (Egipt), arabă (Arabia Saudită), arabă (Emiratele Arabe Unite), central khmer (Cambodgia), croată, greacă, maghiară, poloneză, spaniolă (Spania) și turcă
- OCR de imagine pentru textul chinezesc simplificat tipărit, textul thailandez tipărit și textul finlandez tipărit – Include panouri publicitare preînregistrate, ambalaje externe, semne, reviste și meniuri pentru a antrena și actualiza modelele de recunoaștere optică a caracterelor
- Mișcări ale corpului uman (China) – Include videoclipuri anotate cu oameni care se mișcă, urmărite la nivel de pixel, potrivite pentru dezvoltarea de jocuri, aplicații de fitness și multe altele
- Sunete de plâns de bebeluși (China) – Include sunete de bebeluși preînregistrați și anotați care pot fi utilizați pentru a antrena modele IA pentru a recunoaște diferite sunete de plâns și a alerta părinții
Pentru mai multe informații și pentru a solicita un eșantion de set de date OTS Appen, faceți clic aici.












