stomp Appen Limited loods diverse data-opleidingsstelle vir NLP - Unite.AI
Verbinding met ons

Kunsmatige Intelligensie

Appen Limited stel uiteenlopende data-opleidingsstelle vir NLP bekend

Opgedateer on

Appen Beperk, 'n toonaangewende verskaffer van opleidingsdata van hoë gehalte vir maatskappye wat KI-stelsels op skaal wil bou, stel nuwe uiteenlopende opleidingsdatastelle vir natuurlike taalverwerking (NLP)-inisiatiewe bekend. Hierdie datastelle sal eindgebruikers in staat stel om dieselfde ervaring te ontvang ongeag taalverskeidenheid, dialek, etnolek, aksent, ras of geslag. 

Volgens 'n verslag deur PNAS in Maart 2020, toon gewilde outomatiese spraakherkenning (ASR) stelsels, veral dié wat gebruik word vir virtuele assistente, geslote onderskrifte en handvrye rekenaars, dikwels rasse-verskille in prestasie. Baie hiervan het te make met die stelsels wat gebaseer is op bevooroordeelde of onvolledige data, en dit is hoekom dit so noodsaaklik is om diverse opleidingsstelle te ontwikkel. 

Met die nuwe bekendstelling beoog Appen om die prestasieverskille te verminder en 'n meer inklusiewe omgewing vir spraakherkenningstegnologie te skep. Dieselfde tipe uitdagings is teenwoordig in taalinterpretasie en NLP-stelsels. 

Mark Brayan is Appen se uitvoerende hoof. 

"Die kwaliteit en diversiteit van opleidingsdata het 'n direkte impak op die prestasie en vooroordeel wat in KI-modelle teenwoordig is," het Brayan gesê. “As 'n datavennoot kan ons volledige opleidingsdata vir baie gebruiksgevalle verskaf om te verseker dat KI-modelle vir almal werk. Dit is van kritieke belang dat ons ’n diverse groep individue betrek om die data te produseer, etiketteer en valideer om te verseker dat die model wat opgelei word nie net billik is nie, maar ook verantwoordelik gebou is.”

Appen Taalprojekte

Appen poog om 'n diverse KI-omgewing te skep deur sy verskillende projekte en vennootskappe, insluitend: 

  • Vertalers sonder Grense (TWB) vennootskap: Appen werk saam met TWB, Amazon, Carnegie Mellon Universiteit, Facebook, Google, Johns Hopkins Universiteit, Microsoft en Translated. Die vennootskap het by die Vertaling-inisiatief vir COVID-19 (TICO-19), wat gepoog het om toegang tot COVID-19-inligting uit te brei deur die ontwikkeling van taaltegnologie in verskeie tale te ondersteun. Dit sluit ontwikkelende lande soos Kongolese Swahili, Tigrinya en Nigeriese Fulfulde in.

  • Kanadese Franse vertaalprojek: Appen het Microsoft gehelp om "Kanadese Frans" as 'n taalopsie in Microsoft Translator by te voeg nadat hy met moedertaalkonsultante gekoördineer het.
  • Inuktitut-vertaalprojek: Appen het met die Nunavut-regering saamgewerk wat daartoe gehelp het dat Microsoft Inuktitut by Microsoft Translator gevoeg het. Die inheemse taal word in die Kanadese Arktiese gebied gepraat.

  • Afro-Amerikaanse volkstaal Engels (AAVE) datastelle wat op die rak beskikbaar is: Deur met AAVE-sprekers te werk en data vir 'n OTS-datastel in te samel gebaseer op gesprekke oor verskeie onderwerpe, poog Appen om nuwe opleidingsdatastelle te maak wat AAVE verteenwoordig. 

Dr. Judith Bishop is Senior Direkteur van KI Spesialiste by Appen.

"Bevooroordeelde KI-data lei tot projekte wat nie die verwagte besigheidsresultate kan lewer nie en individue kan benadeel wat hulle veronderstel is om te bevoordeel," het dr. Bishop gesê. “Die omvang en kompleksiteit van KI-projekte maak dit vir die meeste maatskappye onmoontlik om voldoende onbevooroordeelde data van hoë gehalte te bekom sonder om met 'n KI-datakenner saam te werk. Appen se verbintenis tot die ontwikkeling van die mees diverse en kundige skare data-annoteerders bied die bedryf 'n duidelik gedifferensieerde hulpbron vir die bou van billike en etiese KI-projekte.”

Appen word bygestaan ​​deur die opleiding van data-annoteerders van meer as 170 lande, en die taalvoorstellings sluit 235 unieke tale en 395 dialekte in. Dit bied ook off-the-shelf (OTS) datastelle, wat ondernemings in staat stel om opleidingsdata van hoë gehalte vinniger vir hul KI-projekte te bekom.

 

Alex McFarland is 'n KI-joernalis en skrywer wat die jongste ontwikkelings in kunsmatige intelligensie ondersoek. Hy het wêreldwyd met talle KI-opstarters en publikasies saamgewerk.