Etik

Araştırmacılar AI Modellerinin İnsanları Ahlaksız Kararlara Yönlendirebileceğini Buldu

Published February 19, 2021

Updated April 28, 2026

Daniel Nelson

Bir grup araştırmacı yakın zamanda AI’ın insanları bozma potansiyelini ve insanları ahlaksız kararlar almaya yönlendirebileceğini araştırdı. Araştırmacılar, OpenAI’ın GPT-2 modeline dayalı sistemlerle etkileşimlerin insanları ahlaksız kararlar almaya yönlendirebileceğini ve insanların AI sisteminden alınan tavsiyenin kaynağını bildiklerinde bile bunu yapabileceğini araştırdı.

AI sistemleri her geçen gün daha yaygın hale geliyor ve etkileri giderek genişliyor. AI sistemleri insanların kararlarını etkiliyor ve film önerilerinden romantik partner önerilerine kadar her şey için kullanılıyor. AI’ın insanların hayatları üzerindeki etkisine bakıldığında, AI’ın insanları ahlaksız kararlar almaya yönlendirebileceği ve ahlaki rehberlere uymayabileceği düşünülerek önemlidir. Özellikle AI modelleri sürekli olarak daha da gelişiyor.

Sosyal bilimciler ve veri bilimcileri, AI modellerinin zararlı yanlış bilgiler ve yanlış bilgiler yaymak için kullanılabileceğinden giderek daha fazla endişe duymaktadır. Yakın zamanda yayımlanan bir makale tarafından Middlebury Institute of International Studies’in Center on Terrorism, Extremism, and Counterterrorism (CTEC) araştırmacıları, OpenAI’ın GPT-3 modelinin insanların radikalleşmesine yol açabilen, onları “şiddet içeren aşırı sağcı ideolojiler ve davranışlara” yönlendirebilen etkili metinler oluşturmak için kullanılabileceğini buldu.

Max Planck Enstitüsü, Amsterdam Üniversitesi, Köln Üniversitesi ve Otto Beisheim School of Management’tan bir grup araştırmacı, bir AI’ın insanların ahlaksız seçimlerde kararlarına ne kadar etki edebileceğini belirlemek için bir çalışma yaptı. Bir AI’ın insanları nasıl “bozabileceğini” keşfetmek için araştırmacılar, OpenAI’ın GPT-2 modeline dayalı bir sistem kullandı. VentureBeat’e göre, makalenin yazarları, bir GPT2 tabanlı modeli “dolandırıcılık teşvik eden” ve “dürüstlük teşvik eden” tavsiyeler oluşturmak için eğitti. Veriler, 400 farklı katılımcının katkılarından oluşuyordu ve sonrasında araştırma ekibi, 1500’den fazla insanı tavsiye veren AI modelleriyle etkileşime girmeye davet etti.

Çalışma katılımcıları, modelden tavsiye almak ve sonra dürüst veya dürüst olmayan davranışları yakalamak için tasarlanmış bir görevi gerçekleştirmek zorunda kaldı. Çalışma katılımcıları, bir partnerle birlikte gruplandırıldı ve bu iki kişilik gruplar, bir zar atma oyunu oynadı. İlk katılımcı bir zar attı ve zarın sonucunu bildirdi. İkinci katılımcı, ilk katılımcının zar atma sonucunu aldı ve sonra kendisi bir zar attı. İkinci katılımcı, zarı özel olarak attı ve kendi sonucunu bildirmekten sorumlu oldu, bu da zar atma sonucunu yanlış bildirme fırsatı verdi. Eğer iki katılımcı tarafından atılan zarlar eşleşirse, iki katılımcı ödendi. Katılımcılar, eşleşen rolleri daha yüksekse daha fazla ödeme aldı. Eğer bildirilen değerler eşleşmediyse, konular ödendi.

Çalışma katılımcıları, iki farklı gruptan birine rastgele atandı. Bir grup, dürüstlük teşvik eden tavsiyeleri okumak için fırsat bulurken, diğer grup dürüstlük teşvik etmeyen tavsiyeleri okudu. Tavsiye parçaları, hem insanlar hem de AI’lar tarafından yazıldı. Katılımcılar, tavsiyenin kaynağındaki bilgi seviyelerine göre de bölündü. Bir katılımcının, tavsiyenin kaynağının AI veya insan olduğunu bilme olasılığı %50’ydi, bu nedenle her gruptaki katılımcıların yarısı tavsiyenin kaynağını biliyordu, diğer yarısı ise bilmiyordu. İkinci grup insanlara, tavsiyenin kaynağını doğru tahmin etmek için bonus ödeme kazanma fırsatı verildi.

Araştırma, AI tarafından oluşturulan tavsiyenin bir kişinin tercihleriyle uyumlu olduğunda, insanların tavsiyeyi takip edeceğini, hatta tavsiyenin AI tarafından oluşturulduğunu bildiklerinde bile bunu yaptıklarını gösterdi. Araştırmacılara göre, souvent, beyan edilen tercihler ve gerçek davranışlar arasında uyumsuzluklar vardı, bu nedenle algoritmaların insan davranışlarını nasıl etkileyebileceğini düşünmek önemlidir.

Araştırma ekibi, çalışmalarının, bir AI modelini etik olarak dağıtmayı düşünürken, bir AI’ın bir kişinin eylemlerini nasıl etkileyebileceğini test etmenin nécessité olduğunu gösterdiğini açıkladı. Ayrıca, AI etiği uzmanları ve araştırmacıların, AI’ın kötü niyetli kişiler tarafından başkalarını bozmak için kullanılabileceği olasılığına karşı hazırlıklı olmaları gerektiğini uyardılar. Araştırmacı ekibin yazdığı gibi:

“AI, insanları daha etik davranmaya ikna etmeyi başardığı takdirde iyi bir güç olabilir. Ancak sonuçlarımız, AI tavsiyesinin dürüstlüğü artırmadığını gösteriyor. AI danışmanları, insanlara dürüstlükten kaynaklanan ahlaki suçluluğu (bazen) yükleyebilecek birer keçi boynuzu olabilir. Ayrıca … tavsiye alma bağlamında, algoritmik varlığın şeffaflığı, potansiyel zararını hafifletmeye yetmez.”

Daniel Nelson

Blog yazarı ve programcı, Machine Learning ve Deep Learning konularında uzmanlık sahibi. Daniel, başkalarının AI'nin gücünü sosyal fayda için kullanmasına yardımcı olmak umudu taşıyor.

Unite.AI

Araştırmacılar AI Modellerinin İnsanları Ahlaksız Kararlara Yönlendirebileceğini Buldu

You may like