никулец Нови збирки на податоци надвор од полица (OTS) од Appen Accelerate AI Deployment - Unite.AI
Поврзете се со нас

Вештачка интелигенција

Нови збирки на податоци надвор од полица (OTS) од Appen Accelerate AI Deployment

mm
Ажурирани on

Appen Limited (ASX:APX), водечки снабдувач на висококвалитетни податоци за обука за организации кои градат ефективни системи за вештачка интелигенција на размер, денес објави нови сетови на податоци надвор од полица (OTS).. Овие збирки на податоци се дизајнирани да им олеснат и побрзо на бизнисите да стекнат висококвалитетни податоци за обука потребни за забрзување на нивните проекти за вештачка интелигенција (AI) и машинско учење (ML). Новите збирки податоци на OTS вклучуваат движење на човечкото тело и иновативни звуци на плачење на бебиња, како и скриптен говор и слики со текст погоден за оптичко препознавање знаци (OCR) за јазици со голема побарувачка, но тешко достапни, како што се арапски, хрватски, грчки , унгарски, тајландски и многу повеќе. Со проширените збирки на податоци, вкупната понуда на ОТС на Appen вклучува над 250 сетови на податоци, кои се состојат од над 11,000 часа аудио, над 25,000 слики и над 8.7 милиони зборови на 80 јазици и повеќе дијалекти.

Збирките на податоци OTS на Appen се брза, економична алатка за да започнете проект за вештачка интелигенција или ML со постојани висококвалитетни податоци за обука. Тимовите што ги прошируваат своите способности за вештачка интелигенција, исто така, можат да ги искористат збирките на податоци на OTS за ефективно да ја подобрат прецизноста, да развијат вештини за нови модели и да вклучат други подобрувања во нивните модели со вештачка интелигенција. Дата на податоци OTS често се доставува за една недела, на пример, во споредба со осум до дванаесет недели за ново собирање податоци и проект за прибелешки - или уште подолго, во зависност од сложеноста. Сите збирки на податоци на Appen се развиени со користење на целосно транспарентна методологија за одлучување, така што специјалистите за вештачка интелигенција можат да се уверат дека нивните податоци се чисти и усогласени, со што се елиминира потенцијалниот ризик од реакција и оштетување на угледот.

„Тимовите за вештачка интелигенција ширум светот кои работат на проекти со тесни рокови и флексибилни барања за податоци можат да имаат корист од користењето на сетови на податоци надвор од полица“, рече Вилсон Панг, CTO на Appen. „Збирките на податоци OTS го скратуваат времето за вреднување и обезбедуваат пристап до висококвалитетни податоци по пониски вкупни трошоци отколку со користење на традиционални методи. Ние во Апен ги преземаме неопходните чекори за да се осигураме дека сите наши збирки на податоци се етички извори и демографски избалансирани, овозможувајќи им на компаниите да одржуваат одговорни практики за вештачка интелигенција преку минимизирање на пристрасноста во нивните модели и обезбедување фер третман на прибележувачите на податоците. Секогаш го знаете прецизниот квалитет на базата на податоци OTS, што помага да се изгради подобра вештачка интелигенција која работи во реалниот свет“.

MediaInterface испорачува јазични технолошки решенија до институциите поврзани со здравствената заштита во Германија и другите делови на Европа повеќе од 20 години. Кога компанијата се прошируваше во Франција, имаше целосно локализиран софтвер, но немаше податоци за францускиот лексикон, особено француските имиња и места, кои често се референцирани во информациите за здравјето на пациентите. Користење на сетови на податоци Appen OTS, Добиен е MediaInterface приближно 21,000 француски имиња и 14,000 имиња на места. „Критичните податоци од Appen се инкорпорирани во нашиот позадински лексикон за успешно лансирање на нов пазар, а тоа ни помага да изградиме нов речник за нашите клиенти и да го зајакнеме нашиот пристап и за идните лансирања на пазарот“, рече Инес Вендлер, менаџер за производи. на MediaInterface.

Најискусните експерти за вештачка интелигенција комбинираат збирки на податоци за OTS со собирање податоци и проекти за прибележување на барање за да ги задоволат нивните сложени потреби за податоци за обука за модели на вештачка интелигенција. Appen е лидер во понудата на континуирана поддршка преку низа специфични услуги за собирање податоци, како што се тековни прибелешки и паметно означување на податоци, преку алатки напојувани со вештачка интелигенција и автоматизирани работни текови за да се зголеми ефикасноста.

„Ние комуницираме со вештачката интелигенција од моментот кога ќе се разбудиме до моментот кога ќе одиме во кревет – преку виртуелни асистенти, чет-ботови, пребарувачи, социјални мрежи, медицински уреди, паметни автомобили и други апликации“, рече Џудит Бишоп, виш директор на АИ на Апен. специјалисти, кои раководат со тим од 100 лингвисти и јазични експерти за вештачка интелигенција. „Јазикот е често примарен интерфејс за многу од овие привлечни случаи на употреба на вештачка интелигенција, така што за да се гарантира одлично искуство, моделот треба да се обучи да работи за секого. Посветеноста на Апен за висококвалитетни податоци и одговорен, етички развој на вештачката интелигенција им овозможува на компаниите што ги купуваат нашите збирки на податоци од полица да ги забрзаат своите проекти за вештачка интелигенција со целосна доверба во нивните податоци“.

Приклучувањето кон постоечките стотици збирки на податоци веќе трае appen.com, списокот на нови сетови на податоци на Appen OTS што сега се достапни вклучува:

  • Скриптен говор за арапски (Египет), арапски (Саудиска Арабија), арапски (Обединети Арапски Емирати), централни кмери (Камбоџа), хрватски, грчки, унгарски, полски, шпански (Шпанија) и турски
  • Слика OCR за поедноставен кинески печатен текст, тајландски печатен текст и фински печатен текст – Вклучува претходно снимени билборди, надворешно пакување, знаци, списанија и менија за обука и ажурирање на моделите OCR за компјутерска визија
  • Движење на човечко тело (Кина) – Вклучува прибелешки видеа од луѓе кои се движат, следени на ниво на пиксели, погодни за развој на игри, апликации за фитнес и друго
  • Аудио за плачење на бебиња (Кина) - Вклучува однапред снимени и бележени звуци на бебиња што може да се користат за обука на моделите со вештачка интелигенција да препознаваат различни звуци на плачење и да ги предупредуваат родителите

За повеќе информации и да побарате примерок од податоци на Appen OTS, Кликни тука.