Yapay Genel Zeka
Amazon Alexa'nın Baş Araştırmacısı Turing Testinin Eski Olduğunu Savunuyor

Amazon'da Alexa'nın başkan yardımcısı ve baş bilim adamı Rohit Prasad, Son zamanlarda savundu ki Turing testiUzun süredir yapay zeka modellerinin karmaşıklığını ölçmek için kullanılan , yapay zeka için bir ölçüt olarak kullanımdan kaldırılmalıdır.
Bilgisayar bilimcisi ve matematikçi Alan Turing, Turing testi kavramını ilk olarak 70 yıldan fazla bir süre önce ortaya attı. Turing testinin amacı, bir makinenin insani anlamda "düşünme" yeteneğine sahip olup olmadığını belirleyerek makine zekası sorusunu yanıtlamaya yardımcı olmaktı. Bu soruyu cevaplamak için Turing, eğer makineler, bir insan gözlemcinin bilgisayarın diyaloğu ile bir insanın diyaloğu arasında ayrım yapamayacağı kadar karmaşık konuşma davranışı sergileyebiliyorsa, makinenin düşünme yeteneğine sahip olduğunun düşünülmesi gerektiğini savundu.
Turing Testi Sınırlamaları
Prasad, Turing testinin birçok yönden sınırlı olduğunu ve hatta Turing'in kendisinin bu sınırlamalardan bazılarına dikkat çektiğini savundu. ilk makalesinde. Prasad, AI'nın hayatımızın her yönüne giderek daha fazla entegre hale gelmesiyle, insanların bir insandan ayırt edilemez olmasını daha az önemsediğini ve AI ile etkileşimlerinin sorunsuz olmasını daha çok önemsediğini savunuyor. Bu nedenle, Turing testi eskimiş olarak kabul edilmeli ve daha kullanışlı kıyaslamalarla değiştirilmelidir.
Prasad, birçok eski sohbet robotunun Turing testini geçmek için tasarlandığını ve son yıllarda bazı sohbet robotlarının insan yargıçların üçte birinden fazlasını (Turing testini geçmek için gerekli olan çıta) sürekli olarak kandırmayı başardığını kaydetti. Bununla birlikte, insanların konuşma kalıplarını başarılı bir şekilde taklit edebilmek bir makinenin gerçekten "akıllı" olarak kabul edilebileceği anlamına gelmez. AI modelleri, bir alanda son derece yetkin olabilir ve diğerlerinde son derece eksik olabilir ve hiçbir genel zekaya sahip olmayabilir. Buna rağmen Turing testi, sohbet robotları ve dijital asistanlar için yaygın olarak kullanılan bir kriter olmaya devam ediyor ve Prasad, iş dünyası liderlerinin ve gazetecilerin sürekli olarak Alexa'nın Turing testini ne zaman geçebileceğini sorduğunu belirtiyor.
Prasad'a göre, makine zekasını değerlendirmek için Turing testinin kullanılmasıyla ilgili başlıca sorunlardan biri, makinelerin bilgi arama ve yıldırım hızında hesaplamalar yapma yeteneğini neredeyse tamamen azaltmasıdır. AI programları, insanları kandırmak için karmaşık matematik ve coğrafya sorularına yanıt olarak yapay duraklamalar enjekte eder, ancak bu tür sorulara neredeyse anında yanıt verirler. Bunun ötesinde Turing testi, yapay zekanın dış sensörler tarafından toplanan verileri kullanma konusundaki artan yeteneğini hesaba katmaz ve yapay zekaların yalnızca metin iletişimine dayanarak görme ve hareket algoritmaları aracılığıyla çevrelerindeki dünyayla nasıl etkileşime girebileceğini göz ardı eder.
Yeni Karşılaştırmalar Oluşturma
Prasad, zekayı ölçmenin yeni biçimlerinin, genel bir zeka türünü değerlendirmek için daha uygun yöntemlerin yaratılması gerektiğini savundu. Bu testler, yapay zekanın modern toplumda gerçekte nasıl kullanıldığını ve insanların onu kullanma hedeflerini yansıtmalıdır. Testler, bir yapay zekanın insan zekasını ne kadar iyi artırdığını ve yapay zekanın insanların günlük yaşamlarını ne kadar iyi iyileştirdiğini belirleyebilmelidir. Ayrıca bir test, bir yapay zekanın dil yeterliliği, kendi kendini denetleme ve "sağduyu" dahil olmak üzere insan benzeri zeka özelliklerini nasıl gösterdiğini anlamalıdır.
Muhakeme, adalet, konuşma ve duyusal anlama gibi AI araştırmasının mevcut ve önemli alanları Turing testi tarafından değerlendirilmez, ancak çeşitli şekillerde ölçülebilir. Prasad, zekanın bu özelliklerini ölçmenin bir yolunun, zorlukları kurucu görevlere ayırmak olduğunu açıkladı. Değerlendirme için başka bir yöntem, insan-bilgisayar etkileşimi için büyük ölçekli bir gerçek dünya sorunu yaratmaktır.
Amazon, Alexa Prize'ı yarattığında, sosyal robotların bir insanla 20 dakika konuşmasını gerektiren bir değerlendirme listesi oluşturdu. Botlar, teknoloji, spor, politika ve eğlence gibi çok çeşitli konularda tutarlı bir şekilde sohbet etme becerilerine göre değerlendirilecek. Müşteriler, geliştirme aşamasında botları puanlamaktan ve botla tekrar sohbet etme isteklerine göre puanlar vermekten sorumluydu. Son turda, botları 5 puanlık bir ölçek kullanarak derecelendirmekten bağımsız jüri üyeleri sorumluydu. Jüri tarafından kullanılan değerlendirme listesi, yapay zekaların uygun olduğunda empati gibi önemli insan niteliklerini sergilemesine izin veren yöntemlere dayanıyordu.
Nihayetinde Prasad, Alexa gibi yapay zeka destekli cihazların çoğalmasının, yapay zekanın ilerlemesini ölçmek için önemli bir fırsatı temsil ettiğini, ancak bu yeni fırsattan yararlanmak için farklı ölçümlere ihtiyacımız olacağını savundu.
Prasad, "Bu tür AI'ların, yalnızca göreve özgü zeka yerine daha genelleştirilmiş öğrenme yeteneği ile mümkün olan çok sayıda, sürekli artan görevde uzman olması gerekiyor." "Bu nedenle, önümüzdeki on yıl ve sonrasında, ortam cihazlarında konuşma ve proaktif yardım yetenekleriyle AI hizmetlerinin kullanımı değerli bir testtir."






