Yapay Zeka
Appen Limited, NLP için Çeşitli Veri Eğitim Setlerini Başlatıyor

Appen SınırlıGeniş ölçekte yapay zeka sistemleri oluşturmak isteyen şirketler için yüksek kaliteli eğitim verilerinin lider sağlayıcısı olan , doğal dil işleme (NLP) girişimleri için yeni ve çeşitli eğitim veri kümeleri başlatıyor. Bu veri setleri, son kullanıcıların dil çeşitliliği, lehçesi, etnik kökeni, aksanı, ırkı veya cinsiyeti ne olursa olsun aynı deneyimi yaşamasını sağlayacak.
Bir göre rapor Mart 2020'de PNAS tarafından, popüler otomatik konuşma tanıma (ASR) sistemleri, özellikle sanal asistanlar, alt yazı ve eller serbest bilgi işlem için kullanılanlar, genellikle performansta ırksal eşitsizlikler sergiliyor. Bunun çoğu, sistemlerin önyargılı veya eksik verilere dayanmasıyla ilgilidir ve bu nedenle çeşitli eğitim setleri geliştirmek çok önemlidir.
Appen, yeni lansman ile performans farklılıklarını azaltmayı ve konuşma tanıma teknolojisi için daha kapsayıcı bir ortam yaratmayı hedefliyor. Dil yorumlama ve NLP sistemlerinde aynı türden zorluklar mevcuttur.
Mark Brayan, Appen CEO'sudur.
Brayan, "Eğitim verilerinin kalitesi ve çeşitliliği, AI modellerinde mevcut olan performansı ve önyargıyı doğrudan etkiler" dedi. "Bir veri iş ortağı olarak, yapay zeka modellerinin herkes için çalışmasını sağlamak üzere birçok kullanım durumu için eksiksiz eğitim verileri sağlayabiliriz. Eğitilmekte olan modelin yalnızca adil değil, aynı zamanda sorumlu bir şekilde inşa edildiğinden emin olmak için verileri üretmek, etiketlemek ve doğrulamak üzere farklı bireylerden oluşan bir grupla çalışmamız çok önemlidir.”
Appen Dil Projeleri
Appen, aşağıdakiler de dahil olmak üzere farklı projeleri ve ortaklıkları aracılığıyla çeşitli bir yapay zeka ortamı yaratmaya çalışır:
- Sınır Tanımayan Çevirmenler (TWB) ortaklığı: Appen, TWB, Amazon, Carnegie Mellon Üniversitesi, Facebook, Google, Johns Hopkins Üniversitesi, Microsoft ve Translated ile ortaklık kurdu. Ortaklık katıldı COVID-19 için Çeviri Girişimi (TICO-19), birden fazla dilde dil teknolojisinin gelişimini destekleyerek COVID-19 bilgilerine erişimi genişletmeye çalıştı. Bunlar, Kongolu Swahili, Tigrinya ve Nijeryalı Fulfulde gibi gelişmekte olan ülkeleri içerir.
- Kanadalı Fransızca çeviri projesi: Appen, yerel dil danışmanlarıyla koordineli çalıştıktan sonra Microsoft'un Microsoft Translator'a bir dil seçeneği olarak "Kanada Fransızcası" eklemesine yardımcı oldu.
- İnuitçe çeviri projesi: Appen, Microsoft'un Microsoft Translator'a İnuitçe eklemesine yardımcı olan Nunavut Hükümeti ile işbirliği yaptı. Yerli dil Kanada Arktik bölgesinde konuşulmaktadır.
- Afro-Amerikan Yerel İngilizcesi (AAVE) kullanıma hazır veri kümeleri: Appen, AAVE konuşmacılarıyla çalışarak ve çeşitli konulardaki konuşmalara dayalı bir OTS veri kümesi için veri toplayarak, AAVE'yi temsil eden yeni eğitim veri kümeleri oluşturmaya çalışır.
Dr. Judith Bishop, Appen'de Yapay Zeka Uzmanlarının Kıdemli Direktörüdür.
Bishop, "Önyargılı yapay zeka verileri, beklenen iş sonuçlarını sağlamada başarısız olabilecek ve fayda sağlamaları gereken kişilere zarar verebilecek projelere yol açıyor" dedi. "Yapay zeka projelerinin ölçeği ve karmaşıklığı, çoğu şirketin bir yapay zeka veri uzmanıyla iş birliği yapmadan yeterli düzeyde tarafsız, yüksek kaliteli veri elde etmesini imkansız kılıyor. Appen'in en çeşitli ve uzman veri yorumcuları topluluğunu geliştirme taahhüdü, sektöre adil ve etik yapay zeka projeleri oluşturmak için açıkça farklılaştırılmış bir kaynak sağlıyor.”
Appen'e 170'den fazla ülkeden veri anlatıcıları tarafından yardım edilir ve dil temsilleri 235 benzersiz dil ve 395 lehçe içerir. Ayrıca, işletmelerin yapay zeka projeleri için yüksek kaliteli eğitim verilerini daha hızlı elde etmelerini sağlayan kullanıma hazır (OTS) veri kümeleri de sunar.












