Bizimle iletişime geçin

Yapay Zeka

Yapay Zeka Sistemleri Sayısal Veriler Yerine İnsan Dilini Tercih Edebilir

mm

Yeni araştırmalar Columbia Engineering'den gelen veriler, yapay zeka (AI) sistemlerinin 1'ler ve 0'lar gibi sayısal veriler yerine insan dilini tercih ettiğini öne sürüyor. Makine Mühendisliği Profesörü Hod Lipson ve doktora öğrencisi Boyuan Chen'in yaptığı yeni çalışma, AI sistemlerinin insan dili ses dosyalarıyla programlanması halinde daha yüksek performans seviyelerine ulaşabileceğini gösterdi. 

Yan yana yapılan bir karşılaştırmada araştırmacılar, ses dosyaları tarafından eğitilen bir sinir ağının, basit ikili girdilerle programlanan diğer ağa kıyasla nesneleri tanımlamada daha yüksek performans seviyelerine ulaştığını buldular.

Lipson, James ve Sally Scapa İnovasyon Profesörü ve Columbia'nın Veri Bilimi Enstitüsünün bir üyesidir. 

"Bu bulgunun neden önemli olduğunu anlamak için, sinir ağlarının genellikle nasıl programlandığını ve insan sesini kullanmanın neden radikal bir deney olduğunu anlamakta fayda var" dedi. 

İkili sayıları kullanmak kompakt ve kesindir, insan dili ise bir dijital dosyada yakalandığında daha karmaşık ve ikili değildir. Programcılar, oldukça verimli olduğu için bir sinir ağı geliştirirken genellikle sayılardan sapmazlar.

Ekip, sinir ağlarının tam potansiyeline ulaşmadığını düşündükten sonra bu araştırmaya girişti ve insan sesi ve belirli kelimelerle eğitildikleri takdirde daha hızlı ve daha iyi olabileceklerine inandılar. 

Ağları Eğitmek

Yeni bir makine öğrenimi tekniğini test ederken, yapay zeka araştırmacıları genellikle bir fotoğraf koleksiyonundaki belirli nesneleri ve hayvanları tanımak için bir sinir ağını eğitiyor. 

Chen, Lipson, Yu Li ve Susan Raghupathi'den oluşan ekip, hipotezlerini test etmek için kontrollü bir deney kurdu ve iki yeni sinir ağı oluşturdular. “Eğitim görüntüleri” adı verilen 10 fotoğraf arasından 50,000 farklı türdeki nesneyi tanımaları için onları eğitmek üzere yola çıktılar. 

AI sistemlerinden biri sayısal değerlerle daha geleneksel bir şekilde eğitilirken, deneysel sinir ağı çok farklı şekilde eğitildi. Bir hayvanın veya nesnenin fotoğrafını içeren satırlarla bir veri tablosu beslendi ve ikinci sütunda, hayvan veya nesne için kelimeyi seslendiren bir insan sesi ses dosyası vardı. Deneysel ağda 1'ler veya 0'lar yoktu.

Her iki AI sistemi de toplam 15 saat eğitildi. Sonuçlar, orijinal ağın bir dizi on 1 ve 0 ile yanıt verdiğini, deneysel sinir ağının ise görüntüdeki nesnenin ne olduğunu açıkça "söylemeye" çalışan bir ses ürettiğini gösterdi. Orijinal ses anlaşılır olmasa da, sonunda çoğunlukla doğru olma noktasına ulaştı.

İki ağ, hayvanı veya nesneyi zamanın %92'sinde doğru bir şekilde tanımlayarak eşit derecede iyi performans gösterdi. Araştırmacılar daha sonra deneyi ikinci kez yapmaya karar verdiler, ancak bu kez işlem sırasında daha az fotoğraf kullandılar.

Geleneksel ağ, beklendiği gibi yedek veriler nedeniyle düşük performans gösterdi ve yaklaşık %35 doğruluk oranına düştü. Bununla birlikte, deneysel ağ, daha az veriye sahip olmasına rağmen, %70 doğrulukla iki kez daha başarılı oldu. 

 

Şaşırtıcı Sonuçlar

Bir sonraki sefer ekip, bozuk bir köpek görüntüsü gibi daha zor görüntüler kullandı. Daha zor görüntülerde bile, sesle eğitilmiş sinir ağı zamanın yaklaşık %50'sinde doğruyken, geleneksel ağ yalnızca %20'sinde doğruydu. 

Boyuan Chen, çalışmanın baş araştırmacısıdır.

Chen, "Bulgularımız, bilgisayarlar ve sayılar hakkında düşünmek üzere eğitilen birçok uzmanın yaklaşımıyla doğrudan çelişiyor; ikili girdilerin, benzer bilgi 'zenginliğine' sahip ses akışlarından daha verimli bir makineye bilgi aktarma yöntemi olduğu yaygın bir varsayımdır," diye açıkladı. "Aslında, bu araştırmayı büyük bir yapay zeka konferansına sunduğumuzda, anonim bir hakem, sonuçlarımızın 'çok şaşırtıcı ve sezgisel olmadığını' düşündüğü için makalemizi reddetti."

Lipson, "İnsan dilinin on binlerce yıldır bir optimizasyon sürecinden geçtiğini düşünürseniz, o zaman sözlü kelimelerimizin gürültü ve sinyal arasında iyi bir denge bulması çok mantıklıdır" dedi. "Bu nedenle, Shannon Entropy'nin merceğinden bakıldığında, insan diliyle eğitilmiş bir sinir ağının, basit 1'ler ve 0'larla eğitilmiş bir sinir ağından daha iyi performans göstermesi mantıklı."

Çalışma, 3 Mayıs 2021 tarihinde Uluslararası Öğrenme Temsilleri Konferansında sunulacaktır. 

Chen, "Daha büyük veri kümeleri toplamak yerine yapay zeka sistemlerini eğitmek için yeni ve daha iyi yollar kullanmayı düşünmeliyiz" dedi. "Eğitim verilerini makineye nasıl sunduğumuzu yeniden düşünürsek, öğretmenler olarak daha iyi bir iş çıkarabiliriz."

Lipson, "İnsan evriminin en büyük gizemlerinden biri, atalarımızın dili nasıl edindiği ve çocukların konuşmayı nasıl bu kadar zahmetsizce öğrendiğidir" diye ekliyor. "Eğer yeni yürümeye başlayan çocuklar en iyi şekilde tekrarlanan sözlü talimatla öğreniyorsa, o zaman belki yapay zeka sistemleri de bunu yapabilir."

 

Alex McFarland, yapay zekadaki en son gelişmeleri araştıran bir yapay zeka gazetecisi ve yazarıdır. Dünya çapında çok sayıda yapay zeka girişimi ve yayınıyla işbirliği yaptı.