Connect with us

Yapay Zekâ

Bilgisayar Bilimciler Yapay Zeka’daki Önyargıları Ele Alıyor

mm

Princeton ve Stanford Üniversitesi’nden bilgisayar bilimcileri, şimdi yapay zeka (AI)中的 önyargı sorunlarını ele alıyor. İnsanların resimlerini içeren daha adil veri setleri oluşturmak için yöntemler üzerinde çalışıyorlar. Araştırmacılar, 13 milyondan fazla resim içeren bir veritabanı olan ImageNet ile yakın çalışıyorlar. Geçtiğimiz on yıl boyunca ImageNet, bilgisayar vizyonunun ilerlemesine yardımcı oldu. Yöntemlerini kullanarak, araştırmacılar daha sonra veritabanı için iyileştirmeler önerdiler.

ImageNet nesneler, manzaralar ve insanların resimlerini içerir. Resimleri sınıflandıran makine öğrenimi algoritmaları oluşturan araştırmacılar, ImageNet’i veri kaynağı olarak kullanır. Veritabanının devasa boyutu nedeniyle, otomatik resim toplama ve kalabalık kaynaklı resim açıklamalarının olması gerekliydi. Şimdi, ImageNet ekibi, önyargıları ve diğer sorunları düzeltmeye çalışıyor. Resimlerde souvent insanların olması, ImageNet’in inşasının kasıtsız sonuçlarıdır.

Olga Russakovsky, yardımcı yazar ve Princeton Üniversitesi’nde bilgisayar bilimi yardımcı profesörüdür.

“Bilgisayar vizyonu şimdi gerçekten iyi çalışıyor, bu da onun her yerde, her türlü bağlamda dağıtılması anlamına geliyor” dedi. “Bu, şimdi onun dünyaya olan etkisini konuşma ve bu tür adalet sorunlarını düşünme zamanı anlamına geliyor.”

Yeni makalede, ImageNet ekibi, görsel olmayan kavramları ve saldırgan kategorileri sistematik olarak tanımladı. Bu kategoriler ırksal ve cinsel karakterizasyonları içeriyordu ve ekip bunları veritabanından çıkarmayı önerdi. Ekibin ayrıca, kullanıcıların yaş, cinsiyet ifadesi ve cilt rengi tarafından people’nin resimlerini belirtmesine ve almasına olanak tanıyan bir aracı geliştirdi. Amac, insanların yüzlerini ve resimlerdeki faaliyetlerini daha adil bir şekilde sınıflandıran algoritmalar oluşturmaktır.

Araştırmacıların yaptığı çalışma, 30 Ocak’ta Barselona, ​​İspanya’daki Association for Computing Machinery’nin Adillik, Hesap Verebilirlik ve Şeffaflık Konferansı’nda sunuldu.

“Bu tür konuşmalara katılan araştırmacılar ve laboratuvarlara, bu tür temel teknik uzmanlığa sahip olmak için çok ihtiyaç var” dedi Russakovsky. “Verileri toplamanın gerçekliğini göz önünde bulundurarak, crowdsourcing ile yapılacağını çünkü bu en verimli ve kurulmuş olan boru hattı olduğunu göz önünde bulundurarak, bunu daha adil bir şekilde nasıl yapabiliriz – bu tür önceki tuzaklara düşmeden? Bu makalenin temel mesajı, yapıcı çözümler etrafında.”

ImageNet, 2009 yılında Princeton ve Stanford Üniversitesi’nden bir grup bilgisayar bilimcisi tarafından başlatıldı. Akademik araştırmacılar ve eğitimciler için bir kaynak olarak hizmet etmesi amaçlanmıştı. Sistemin oluşturulması, Princeton mezunu ve öğretim üyesi Fei-Fei Li tarafından yönetildi.

ImageNet, etiketlenmiş resimlerin büyük bir veritabanı haline gelmesini, crowdsourcing kullanımına borçludur. Kullanılan ana platformlardan biri Amazon Mechanical Turk (MTurk) idi ve çalışanlar resimlerini doğrulamak için ödeme yaptı. Bu, bazı sorunlara neden oldu ve birçok önyargı ve uygunsuz kategorizasyon vardı.

Baş yazar Kaiyu Yang, bilgisayar bilimi alanında bir lisans öğrencisidir.

“İnsanlara, büyük bir aday kümesinden doğru resimleri seçmeleri için sorduğunuzda, insanlar bazı resimleri seçmek için baskı hissediyorlar ve bu resimler genellikle ayırt edici veya stereotipik özelliklere sahip olanlar” dedi.

Çalışmanın ilk kısmı, ImageNet’ten potansiyel olarak saldırgan veya hassas kişi kategorilerini filtrelemeyi içeriyordu. Saldırgan kategoriler, küfür veya ırksal veya cinsiyet hakaretleri içeren olanlar olarak tanımlanıyordu. Hassas bir kategori, insanların cinsel yönelimlerine veya dinlerine göre sınıflandırılmasıydı. Farklı geçmişlere sahip 12 lisansüstü öğrencisi, kategorileri açıklamak için getirildi ve onlara bir kategori şüpheliyse etiketlemeleri talimatı verildi. Kategorilerin yaklaşık %54’ü ortadan kaldırıldı veya ImageNet’teki 2.932 kişi kategorisinin 1.593’ü.

MTurk çalışanları, kalan kategorilerin “görünürlüğünü” 1’den 5’e kadar bir ölçekte değerlendirdi. 158 kategori, güvenli ve görülebilir olarak sınıflandırıldı, 4 veya daha yüksek puan aldı. Filtrelenen kategori kümesi, 133.000’den fazla resim içeriyordu ve bilgisayar vizyonu algoritmalarının eğitilmesi için son derece faydalı olabilirdi.

Araştırmacılar, resimlerdeki insanların demografik temsiliyetini incelediler ve ImageNet’teki önyargı düzeyi değerlendirildi. Arama motorlarından sağlanan içerik genellikle erkekleri, açık tenli insanları ve 18-40 yaş arasındaki yetişkinleri överek sunar.

“İnsanlar, resim arama sonuçlarının demografik dağılımının çok önyargılı olduğunu bulmuşlardır ve bu nedenle ImageNet’teki dağılım da önyargılıdır” dedi Yang. “Bu makalede, bunun ne kadar önyargılı olduğunu anlamaya çalıştık ve ayrıca dağılımı dengelemek için bir yöntem önerdik.”

Araştırmacılar, ABD anti-ayrımcılık yasaları tarafından korunan üç özelliği dikkate aldı: cilt rengi, cinsiyet ifadesi ve yaş. MTurk çalışanları, her resimdeki her bir kişinin her bir özelliğini açıkladı.

Sonuçlar, ImageNet içeriğinin önemli bir önyargıya sahip olduğunu gösterdi. En az temsil edilenler, koyu tenli, kadınlar ve 40 yaşın üzerindeki yetişkinlerdi.

Kullanıcıların, kullanıcı tarafından seçilen bir şekilde demografik olarak dengeli bir resim kümesi almasına olanak tanıyan bir web-arayüz aracı tasarlandı.

“Demografilerin doğru bir şekilde dengelenmesi gerektiğini söylemek istemiyoruz, çünkü bu çok açık bir sorun değil” dedi Yang. “Dağılım, dünyanın farklı bölgelerinde farklı olabilir – ABD’deki cilt renklerinin dağılımı, Asya’daki ülkelerden farklıdır, örneğin. Bu nedenle, bu soruyu kullanıcıya bırakıyoruz ve sadece resimlerin dengeli bir alt kümesini almasına olanak tanıyan bir araç sağlıyoruz.”

ImageNet ekibi, şimdi donanımları ve veritabanları için teknik güncellemeler üzerinde çalışıyor. Ayrıca, bu araştırmada geliştirilen kişi kategorilerinin filtrelenmesi ve dengesizlik aracının uygulanmasını yapmaya çalışıyorlar. ImageNet, güncellemelerle birlikte yeniden yayınlanacak ve bilgisayar vizyonu araştırma topluluğundan geri bildirim için bir çağrı yapılacak.

Makale, ayrıca Princeton Ph.D. öğrencisi Klint Qinami ve Bilgisayar Bilimi Yardımcı Profesörü Jia Deng tarafından ortak yazar olarak yazılmıştır. Araştırma, Ulusal Bilim Vakfı tarafından desteklenmiştir.

Alex McFarland yapay zeka muhabiri ve yazarıdır ve yapay zekadaki son gelişmeleri araştırıyor. Birçok yapay zeka başlangıç şirketi ve dünya çapındaki yayınlarda işbirliği yaptı.