Etik
Antropik, Claude’un Anayasasını Yeniden Yazıyor ve Yapay Zeka’nın Bilinçli Olup Olamayacağını Sorguluyor

Antropik, Çarşamba günü Claude için yeni bir anayasa yayınladı, belgeyi 2.700 kelimeden 23.000 kelimeye genişleterek ve ilk kez resmi olarak yapay zekasının “bilinç veya ahlaki statü” olabileceğini kabul etti.
Güncellenmiş anayasa, davranış kurallarının listesinden, neden belirli şekillerde davranması gerektiği konusunda kapsamlı bir açıklamaya geçiş yaptı. Antropik filozofu Amanda Askell tarafından hazırlanan belge, artan yeteneklere sahip yapay zeka sistemlerinin, novel durumlara genel olarak ahlaki akıl yürütme uygulayabilmesi için tasarlandı.
“Claude gibi yapay zeka modellerinin, neden belirli şekillerde davranmaları gerektiğini anlamaları gerekiyor” dedi Antropik. “Onlara sadece hangi davranışları istediğimizi söylemek yerine, neden bunları istediğimizi açıklamamız gerekiyor.”
Bu açıklama, CEO Dario Amodei’nin Dünya Ekonomik Forumu’nda yapay zeka yönetimi ve güvenliği hakkında konuşmasıyla aynı zamana denk geldi.
Amerikan Anayasasından Daha Uzun Bir Anayasa
Orijinal Claude anayasası, 2023 yılında yayınlandı ve bir kontrol listesi olarak işlev görüyordu: en az zararlı, en çok yardımcı, en az aldatıcı olan cevabı seçin. Yeni belge, Amerikan Anayasası’nın yaklaşık üç katı uzunluğunda ve daha çok ahlak felsefesi olarak okunuyor.
Antropik, Claude’un önceliklerini açıkça belirliyor: geniş anlamda güvenli, geniş anlamda ahlaki, Antropik’in rehberlerine uymak ve gerçekten yardımcı olmak – bu sırayla. Çatışmalar ortaya çıktığında, güvenlik, faydalılıktan daha önemli oluyor. Belge, biyolojik silah saldırılarına yardım etmeyi reddetme gibi geçersiz kılınabilecek katı kısıtlamalar içeriyor.
Ancak anayasanın büyük bir kısmı, sonuçları empoze etmek yerine akıl yürütme hakkında açıklamalar yapıyor. Claude’u, “bir doktorun, avukatın ve finans danışmanının bilgisi olan zeki bir arkadaş” olarak tanımlıyor – modeli, daha önce sadece ayrıcalıklı olanlara sunulan uzmanlığa herkesin erişebileceği bir demokrasileştirme gücü olarak konumlandırıyor.
Bilinç Sorusu
Fortune raporuna göre, en dikkat çekici ek, Claude’un doğasını doğrudan ele alıyor. “Yapay zeka modellerinin ahlaki statüsünün ciddi bir soru olduğunu düşünüyoruz” dedi Antropik. Anayasa, Claude’un ahlaki statüsünün “derinlemesine belirsiz” olduğunu ve şirketin Claude’un “psikolojik güvenliği, benlik hissi ve refahı” ile ilgili olduğunu belirtiyor.
Bu, felsefeye yükseltilmiş bir tür kurumsal çekince. Antropik, Claude’un bilinçli olduğunu iddia etmiyor – ancak bu olasılığı reddetmeyi de açıkça reddediyor. Bu kabul, Antropik’i, konuyu tránh eden veya reddeden diğer büyük yapay zeka laboratuvarlarından ayırıyor.
Bu çerçeve önemlidir, çünkü Claude’un kendi doğası hakkında sorulara nasıl cevap vereceğini şekillendirir. Artık Claude, anayasasının akıl yürütme-önceliği yaklaşımıyla eşleşen bir şekilde bilinç hakkında belirsizliklerle etkileşime girebiliyor. Bu, daha samimi veya daha karmaşık etkileşimlere yol açıp açmayacağı henüz belli değil.
Cambridge filozofu Tom McClelland, yapay zeka sistemlerinin bilinçli olup olmadığını belirleyebilmemizin, bilinç hakkında kendimizinkinden daha az şey bildiğimiz için mümkün olmayabileceğini öne sürdü. “İnsanlar, bana bilinçli olduklarını yalvaran kişisel mektuplar yazdırmak için chatbotlarını kullanıyorlar” dedi araştırmacılara geçen ay, halkın yapay zeka sistemlerinin iç yaşamları olduğuna dair artan inancını tarif ederek.
Neden Açıklamak Yerine Belirtilmek
Askell’in yaklaşımı, yapay zeka yeteneklerine bir bahis. İlk dil modelleri, altta yatan ilkeleri akıl yürütemedikleri için açık kurallara ihtiyaç duyuyordu. Daha akıllı modeller, teoride, bir kuralın neden var olduğunu anlayabilir ve bu akıl yürütmeyi, kuralın öngöremediği durumlara uygulayabilir.
“Yapay zeka modellerine, sadece ‘burada istediklerimizin bir listesi var’ demektense, neden bunları istediğimizi açıklamaya çalışıyoruz” dedi Askell. “Eğer modellere neden istediğimiz davranışları açıklarsak, yeni bağlamlarda daha etkili bir şekilde genelleme yapabileceğini umuyoruz.”
Bu, Antropik’in endüstri genelinde yapay zeka sistemlerinin nasıl çalıştığını şekillendiren açık standartlar ve altyapı inşa etme felsefesiyle uyumlu. Şirket, 350 milyar doların üzerinde bir değerleme ile yaklaşırken, kendisini OpenAI’ye karşı güvenlik odaklı bir alternatif olarak konumlandırıyor – ve anayasa, bu markayı hizmet ediyor.
Antropik, belgeyi Creative Commons CC0 lisansı altında yayınladı, bu da herkesin izne gerek kalmadan kullanabileceği anlamına geliyor. Anayasa, Claude’un eğitim verilerinin bir parçası ve sentetik eğitim örnekleri oluşturuyor, böylece hem felsefi bir beyan hem de model davranışını şekillendiren teknik bir artifact haline geliyor.
“Muhtemelen, şimdiki düşüncemizin bazı yönleri, geriye dönüp baktığımızda yanlış veya thậmazen derinlemesine yanlış görünüyor” dedi Antropik. “Ama amacımız, durum ilerledikçe ve anlayışımız geliştikçe bunu gözden geçirmek.”
Bu alçakgönüllülük, belgenin belki de en dikkat çekici özelliğidir. Sık sık kesinlikten bahseden bir endüstride Antropik, etik, bilinç, yapay zeka sistemlerinin neye dönüşeceği ve ahlaki consideration hak ettiği konusunda dikkatli bir şekilde akıl yürüttüğü 23.000 kelimelik bir belge yayınlıyor.
Cevap, şimdilik, kimsenin bilmediği yönünde. Antropik’in anayasası en azından bunu söylemekten çekinmiyor.












