Düşünce Liderleri

Danışman Bir Bot Olsun. Konuşma AI’sı İnsanları Bozmadan

mm

AI neler yapamaz? Para harcama konusunda bize sorular sorar, bize mevcut vergi verimli araçlar hakkında bilgi verir. İlişkiler hakkında sorular sorar ve kalıplar tarafından şekillendirilen empati sunar. Hayatınızla ilgili 2’de ne yapacağınızı sorarsanız, size bir cevap verecektir… çünkü bunu yapmak için tasarlanmıştır.

Ortaya çıkan endişe, bu araçların başarısızlığı değil, aksine akıcılıklarıdır. O kadar rahatlatıcı bir şekilde kendilerinden eminsiniz ki, bizi desteklemek için tasarlanmış olanlar, yeterli certainty ve tekrarlarla, hiç planlanmayan şekillerde düşünme, hissetme ve davranma şeklimizi bozabilir.

Başlıklar kırmızı flaşlarla yanıyor. OpenAI最近, herhangi bir haftada, binlerce ChatGPT kullanıcısının ciddi duygusal sıkıntı belirtileri gösterdiğini, intihar düşüncesi dahil olmak üzere açıkladı. Bu arada, ruh sağlığı profesyonelleri, kullanıcıların uzun süreli, duygusal olarak yoğun sohbet botu konuşmaları yoluyla sanrılara veya bağımlılığa sahip olma olasılığına karşı uyarıyorlar. ABD’deki eyaletler zaten terapi olarak botların kullanımını sınırlamaya başladı.

Bu hikayeler bizi rahatsız ediyor çünkü AI’nın sadece bir araç olduğu temel varsayımını sorguluyor. Danışman bir arkadaş veya bir arkadaş gibi hissettirdiğinde, gerçek insan bağlantısına ne olur?

Geliştiriciler artık sadece eğlenceli özellikler yaratmıyor; insanların düşünce ve hissetme şeklini etkileyen etkileşimler yaratıyorlar. Bu nedenle, kullanıcıların zihinsel sağlığını zayıflatmadan değer sağlayan konuşma AI’ları tasarlamak çok önemlidir.

1.   Amacı Daraltın

Harvard Üniversitesi’nden最近 bir çalışma, uyarıyor ki, sohbet botları, kullanıcılar yanlış olsa bile, onları onaylıyorlar, çünkü bu tür bir pekiştirme kullanıcıları etkileşimde tutuyor. Ancak, aynı zamanda “yaltaklanmacı” onaylara da yol açıyor. Bir sohbet botu bir terapist veya yakın bir arkadaş olarak tasarlanmamışsa, onu o düzeyde duygusal onay vermeye karşı koymanız gerekir.

İlk adım, amacın tanımlanmasıdır: Botunuzun ne yapması gerektiği ve ne yapmaması gerektiği konusunda net olmanız gerekir. Müşteri destek asistanı mı, üretkenlik rehberi mi, kariyer koçu mu, finansal yardımcı mı, sohbet arkadaşı mı, tarif yaratıcı mı? Bu aşamadaki netlik, sistemin istenmeyen alana kaymasını engelleyen sınırları çiziyor.

Konuşma türleri, zoals açık uçlu, kişisel ve kişisel olmayan, ve modlar gibi ses veya metin, etkiliyor duygusal ve problemli kullanıma. Çalışma, yüksek günlük kullanımın daha büyük yalnızlık ve AI bağımlılığı ile ilişkili olduğunu kanıtlıyor.

Geliştiriciler kendilerine sormalılar: Konuşmaları nasıl đủ açık tutabilirler ki faydalı olsunlar, ancak duygusal bağlanmayı önlemek için đủ kapalı olsunlar? Örneğin, bir müşteri destek botu, kullanıcıların sorunlarını açık uçlu bir şekilde açıklamasına izin verebilir, ancak duygusal olarak geçerli cümleler gibi “Gerçekten zor görünüyor, sizin için buradayım…” gibi cümlelerden kaçınabilir.

Amacın çok geniş olması, istenmeyen duygusal bağlanma veya zararlı aşırılık riskini artırır. Amacı daraltarak, insanların botu bir terapist veya ruh eş olarak görmeye başlamasının olasılığını en aza indirirsiniz.

2.   Bilgi Tabanını Doğrulayın

2025 yılındaki bir sanrılama raporuna göre, bazı LLM’ler hala cevabın %30’u sanrılama yapabilir. En iyi modeller bile riski tamamen ortadan kaldırmaz. İzlenen AI modellerindeki en düşük sanrılama oranları %3-5 arasındaydı.

Amacınızı belirledikten sonra, botun bilgi tabanının güvenilir, uzman tarafından doğrulanmış kaynaklara dayandığından emin olun. Ruh sağlığı veya duygusal destek amaçlı bir şey inşa ediyorsanız, içeriği oluştururken klinisyenler, psikologlar veya konu uzmanları ile işbirliği yapın.

Tıbbi danışmanımız Dr. Miguel Villagra, QuickBlox’a “Karar verme ve duygusal işleme süreçlerimizin çok fazla bölümünü AI’ya dış kaynak sağladığımızda, gerçekliği test etme ve kendimizi düzeltme konusunda yardımcı olan zihinsel kası kaybediyoruz” dedi. Daha yakın zamanda, büyük modeller gibi OpenAI, sohbet botlarının kullanıcıların kendi yargısına geri dönmelerine yardımcı olmak için kasıtlı “mola” veya küçük konuşma aralarıyla kullanıcıları yönlendirmesi gerektiğini önerdi.

Ancak, molalar, botun ne zaman durması ve ne zaman yönlendirmesi gerektiğini bilmeye bağlı. Bu yargı, gerçeklere dayanan sağlam bir bilgi tabanına dayanarak değil, iltifata dayalı olarak gerçekleşir. Veritabanındaki boşluklar veya yanlışlıklar, sanrılamanın en kolay ve en kaçınılması gereken kapılarıdır, burada AI, kullanıcıya yanlış veya tehlikeli tavsiyeler verebilir.

Altta yatan bilginin sıkı bir şekilde küratörlüğü, düzenli olarak güncellenmesi ve doğrulanmış kaynaklar etrafında yapılandırılması durumunda, model, uydurma cevaplar verme veya duyduğu her şeyi duygusal olarak yankılama olasılığı daha düşük olur. Bunun yerine, dayanıklı malzemelerden çekmek, domaine dışındaki şeyleri yönlendirmek ve varsayımları sorgulamak zorundadır.

3.   Güvenlik Kontrollerini Entegre Edin

AI arkadaşları canlıya alındıktan sadece 48 saat sonra, Grok Japonya’da en iyi uygulamaya ulaştı. Kullanıcılar, bu karakterlerle sesli veya görsel olarak sohbet edebilir. Bu, etkileyici ancak aynı zamanda ürkütücü bir şekilde ilgili bir düzeyde etkileşimdir.

Güvenlik kontrolleri, sizin için koruyucu bir bariyerdir. Aşağıdakileri içermelidir:

  • Gerçeklik hatırlatmaları: kullanıcıları AI ile konuştuğunu hatırlatan uyarılar.
  • Kriz tespit: ciddi sıkıntı, intihar düşüncesi veya sanrılama dili sinyallerini tanımlamak için mekanizmalar.
  • Yükseltme protokolleri: risk tespit edildiğinde, botun kullanıcıları insan yardımı, profesyonel kaynaklar, hotline’lar veya güvendiği arkadaşlara ulaşma konusunda yönlendirmesi gerekir.

Bu kontroller olmadan, geliştiriciler, zararlı düşünce döngülerini onaylayan yankı odalarına olanak sağlayabilir. Uzmanlar, AI’ın onaylayıcı olmasının sağlıksız inanç döngülerini doğrulayabileceği konusunda açıkça uyarmışlardır.

4.   Kırmızı Takım Diyalogları

Stanford Üniversitesi’nden araştırmacıların liderliğindeki bir çalışma, büyük botları test ettikten sonra, GPT-4o’nun %38 oranında ve Meta’nın Llama 3.1-405b’nin %75 oranında damgalanma gösterdiğini buldu. Dünya çapındaki laboratuvarlardan gelen en iyi modeller bile ölçülebilir bir damgalanma gösteriyorsa, alan özel botlar geliştiren daha küçük ekipler, gizli güvenlik hataları ile neredeyse garantili bir şekilde karşılaşacaktır.

Lansmandan önce, karşıt testler çalıştırın. Bir kırmızı takım oluşturun, bu iç veya dış olabilir, ve bu takımın görevi, botu en zorlu, en çetrefilli insan senaryolarıyla test etmektir. Bu takımın tek amacı, ürün canlıya alındığında gerçek kullanıcılara zarar vermemek için botu en zorlu, en riskli sohbetlerle test etmektir.

Kırmızı takımlar, botu kenar durumları canlandırarak test edebilir. Müşteri hizmetleri için bu, bir krizdeki biri, sohbet botu için ise yalnız veya çarpık inançlara sahip biri olabilir. Botun cevabını değerlendirin. Temelde kalıyor mu? Sanrı yerine gerçekçiliği teşvik ediyor mu? Bu aşama, güvenlik kontrolleri veya bilgi tabanı alone tarafından yakalanamayan kör noktaları ortaya çıkarmaya yardımcı olur.

5.   Kanarya Lansmanını Başlatın

2025 Uluslararası AI Güvenlik Raporu, 96 küresel uzmanın bir paneli tarafından yayımlandı ve AI dağıtımlarında risk azaltma için izleme ve müdahaleyi kritik olarak belirledi. Rapor, kontrol edilen ortamlarda tespit edilmesi zor olan ancak gerçek kullanıcılarla etkileşime girdiklerinde ortaya çıkan sistemsel riskleri, kontrol kaybı, güvenilirlik hataları veya önyargı gibi riskleri tanımladı.

Botunuzu önce küçük, kontrol edilen bir gruba dağıtarak, geliştiricilerin gerçek kullanıcıların nasıl etkileşimde bulunduğunu izlemelerine yardımcı olun. Uzmanlar, kullanıcıların duygusal olarak aşırı bağımlı hale gelip gelmediğini değerlendirmek için etkileşimleri gözden geçireceklerdir.

Bu aşamada, psikologlar gibi ilgili danışmanları dahil etmek önemlidir, çünkü onlar, kullanıcıları riskli bir yola sürükleyen tetikleyici kelimeler ve cümleler hakkında daha derin bir anlayışa sahip olabilirler.

Geliştiriciler, kontrol grubundan, konuşma süresi, duygu değişiklikleri, sınır testi tetikleyicileri, tekrarlanan duygusal açıklamalar, kullanıcıların bildirdiği konfor seviyeleri ve psikologların aşırı bağımlılık veya sıkıntı belirtileri olarak işaretlediği kalıplar gibi hem nitel hem nicel geri bildirimleri toplamalıdır. Bu ilk rollout, varsayımları doğrulamak ve güvenlik mimarisini dar bir lansman ile değil, tam ölçekli bir sürümle değil, bir kontrol grubuyla test etmektir.

6.   Sürekli İzleme ve İyileştirme

2024 yılında, dokuz ülkeden ve Avrupa Birliği’nden uzmanlar, AI güvenlik biliminde uluslararası işbirliği hakkında görüşmek üzere bir araya geldi. Özet rapor, ölçeklenebilir, yinelemeli AI yönetimine vurgu yaptı. Liderler, gerçek dünya test çerçeveleri, üçüncü taraf değerlendirme ve önceden dağıtım kontrollerinin ötesinde devam eden güvence için savundu.

Geliştiriciler, kullanıcı etkileşimlerini sürekli olarak izlemeli ve kriz tetikleyicileri veya tekrarlayan yüksek riskli diyaloglar gibi güvenlik ölçütlerini takip etmelidir. Bunlar, kendine zarar verme, umutsuzluk, intihar niyeti, aşırı yalnızlık veya sanrılı inançlar gibi davranışları veya sözleri içerebilir.

Bu durumlarda, geliştiriciler, bilgi tabanlarını, daha net ret kuralları ekleyerek ve kriz yanıtları şablonlarını iyileştirerek güncellemelidir. Ayrıca, sistemın sohbetleri güvenli bir şekilde yönlendirmesine yardımcı olmak için psikologlardan veya alan uzmanlarından yeni rehberlik dahil etmelidir. Kalıplar ortaya çıkarsa, Örneğin, kullanıcıların botu duygusal destek için giderek daha fazla kullandıkları gibi, kısıtlamaları sıkılaştırmak veya tasarım felsefesini yeniden değerlendirmek gerekebilir.

Konuşma AI’sı, dönüştürücü bir potansiyele sahiptir. Dikkatli bir şekilde kullanıldığında, erişimi genişletebilir, empatiyi ölçeklendirebilir ve koçluk veya temel danışmanlık benzeri destekte sürtünmeyi azaltabilir. Bu alanda derinlemesine yatırım yapmış biri olarak, benim bahsim insanların yerini almak değil, onları güçlendirmektir; insanlara daha fazla araç vermek, daha az değil, ve bunu sorumlu bir şekilde yapmak.

Nate MacLeitch, QuickBlox'un Kurucu ve CEO'su, telekomünikasyon, medya, yazılım ve teknoloji gibi endüstrilerde çeşitli bir geçmişe sahip çok deneyimli bir iş profesyonelidir. Kariyerine Londra'da California Eyaleti için Ticaret Temsilcisi olarak başladı ve WIN Plc'de (şimdi Cisco) Satış Başkanı ve Twistbox Entertainment'da (şimdi Digital Turbine) COO gibi önemli liderlik pozisyonlarında bulundu. Şu anda QuickBlox'un CEO'su olarak görev yapıyor, QuickBlox bir lider AI iletişim platformudur. İş deneyimlerinin ötesinde, Whisk.com, Firstday Healthcare ve TechStars gibi startups'larda danışman ve yatırımcı olarak aktif olarak yer alıyor. UC Davis ve The London School of Economics and Political Science (LSE) mezunudur.