Yapay Zeka

Bir Ruh Sağlığı Yapay Zeka Aracı, Yanlışlıkla Doğru Deepfake Tespitini Nasıl Keşfetti?

Yayınlanan Ocak 14, 2026

Salome Beyer Velez

Teknoloji devi Open AI başlattı Amiral gemisi Sora 2'nin Eylül 2025'te piyasaya sürülmesiyle birlikte, deepfake videolar sosyal medya platformlarını istila etti ve izleyicileri potansiyel olarak tehlikeli hiper-gerçekçi içerikle giderek daha fazla tanıştırdı.

Open AI, Sora 2'nin sorumlu bir şekilde piyasaya sürülmesini en önemli öncelik olarak görse de, iddia Ekim 2025'te kullanıma sunulması planlanan bu özellik, kullanıcılara "akışlarında ne gördüklerini kontrol etme araçları ve seçenekleri" sunacak ve görünümleri üzerinde baştan sona kontrol sağlayacak. ders çalışma Modelin ürettiği videoların %80'inin yanlış iddia içerdiği tespit edildi.

Videolardan taklit edilen Moldovalı bir seçim görevlisinin oy pusulalarını imha ettiğine dair haberlerden, göçmenlik memurları tarafından gözaltına alınan bir çocuğun uydurma sahnelerine veya bir Coca-Cola sözcüsünün şirketin Super Bowl'a sponsor olmayacağını açıklamasına kadar, birbirine bağlı bir dünyada yanlış bilgi üretmenin riskleri son derece yüksek.

Sora'nın Ötesinde: Vishing

Open AI'nin aracı piyasaya sürülmeden önce bile, deepfake dosyalarının oluşturulması ve çevrimiçi olarak yayılması artış gösteriyordu. Göre Siber güvenlik firması DeepStrike'ın Eylül 2025 tarihli raporuna göre, deepfake içerik 2023'te 500,000'den 2025'te şaşırtıcı bir şekilde 8 milyona yükseldi ve bunların büyük bir kısmı dolandırıcılık amacıyla kullanıldı.

Bu eğilim durma belirtisi göstermiyor; yalnızca ABD'de yapay zeka dolandırıcılığı vakaları oldukça yüksek. beklenen 2027 yılına kadar 40 milyar ABD dolarına ulaşması.

Bu artış sadece nicelikle sınırlı değil. Sora 2 ve Google'ın araçları gibi araçlarla birlikte... Veo 3Yapay zekâ tarafından oluşturulan yüzlerin, seslerin ve tam vücut performanslarının içeriği artık her zamankinden daha gerçekçi. işaret Bilgisayar bilimci ve deepfake araştırmacısı Siwei Luy'a göre, çağdaş modeller bozulma veya çarpıtma olmadan istikrarlı yüzler üretebiliyor, ses klonlama ise "ayırt edilemez bir eşiği" aşmış durumda.

Gerçek şu ki, deepfake'ler tespit edilme oranlarından daha hızlı yayılıyor. Teknoloji şirketleri ne yapıyor? satmak Olimpik jimnastik gösterilerinden sofistike arka plan seslerine kadar her şeyi üretmek için eğlenceli araçlar olarak kullanılan deepfake teknolojisi, suçlular tarafından işletmeleri ve bireyleri hedef almak için de kullanılmıştır. Sadece 2025 yılının ilk yarısında deepfake olayları yaşanmıştır. istendiğinde Şirketler için 356 milyon ABD doları, bireyler için ise 541 milyon ABD doları kayıp söz konusu.

Geleneksel deepfake tespiti – dahil olmak üzere Filigranları, rötuşlanmış yüzleri ve meta veri kontrollerini belirleme işlemi başarısız oluyor. Ve sesli deepfake'ler kalmak Yapay zekâ destekli dolandırıcılığın ve sesli kimlik avının (vishing) en yaygın ikinci biçimi. arttığını 2025'te %442'lik bir artış bekleniyor, sonuçları şimdiden hissediliyor.

"Artık birkaç saniyelik ses kaydı, doğal tonlama, ritim, vurgu, duygu, duraklamalar ve nefes alma sesleri de dahil olmak üzere inandırıcı bir klon oluşturmak için yeterli," diyor Lyu. yazdı.

İnsanları Dinlemenin Bilimi

Kintsugi, klinik depresyon ve anksiyete belirtilerini tespit etmek için yapay zeka tabanlı ses biyobelirteç teknolojisi geliştiren bir sağlık teknolojisi girişimidir. Çalışmaları, görünüşte basit bir önermeden yola çıktı: İnsanları dinlemeliyiz.

Unite.AI ile yaptığı görüşmede CEO Grace Chang, “Kintsugi'ye kişisel olarak yaşadığım bir sorun nedeniyle başladım. İlk terapi randevusu almak için neredeyse beş ay boyunca terapistimi aradım, ancak kimse geri dönüş yapmadı. Denemeye devam ettim, ancak çok net bir şekilde şunu düşündüğümü hatırlıyorum: Eğer bu benim babam veya kardeşim olsaydı, benden çok önce bırakırlardı,” dedi.

Kaliforniya merkezli şirket, Chang'in "triyaj darboğazı" olarak tanımladığı bir soruna çözüm olarak 2019 yılında kuruldu. Kurucu, ciddiyeti daha erken ve pasif bir şekilde tespit etmenin, insanların doğru bakım seviyesine daha hızlı ulaşmasına yardımcı olabileceğine inanıyordu. Ayrıca, Kintsugi Voice yöntemiyle ses biyobelirteçleri klinik depresyon ve anksiyeteyi tespit edebiliyor.

Yapay zekâ destekli konuşma ve ses analizinin ruh sağlığı sorunları için bir biyobelirteç olarak başarılı kullanımını kanıtlayan çok sayıda araştırma bulunmaktadır. Örneğin, Mayıs 2025 tarihli bir makale, bulundu Akustik biyobelirteçlerin ruh sağlığı ve nörodiverjansın erken belirtilerini tespit edebileceğini ve hastaların potansiyel bilişsel gerilemesini değerlendirmek için şarkı söyleme analizlerinin klinik ortamlara entegre edilmesi gerektiğini savundu.

Ses ölçümlerinin, depresyonu olan kişileri olmayanlardan ayırt etmede %78 ila %96 arasında doğruluk oranına sahip olduğu doğrudur. göre Amerikan Psikiyatri Birliği'ne. Bir diğeri ders çalışma Bireyin belirli bir kategori içinde mümkün olduğunca çok kelime söylemesini gerektiren bir dakikalık bir sözel akıcılık testi kullanıldı ve bir kişinin hem depresyon hem de anksiyete yaşadığını tespit etmede %70 ila %83 doğruluk oranı bulundu.

Kintsugi, kullanıcılarının ruh sağlığını değerlendirmek için kısa bir konuşma kaydı talep ediyor; ardından ses biyobelirteç teknolojisi, ses perdesini, tonlamayı, sesi ve duraklamaları analiz ediyor. bulundu Depresyon, anksiyete, bipolar bozukluk ve bunama gibi rahatsızlıklarla ilişkilendirilebilir.

Ancak Chang'ın başlangıçta fark etmediği şey, bu teknolojinin güvenlik sektörünün günümüzdeki en acil sorunlarından birini, yani insan seslerini insana özgü kılan unsurları belirleme sorununu çözmüş olmasıydı.

Ruh Sağlığı Hizmetlerinden Siber Güvenliğe

Chang, 2025 yılının sonlarında New York'ta düzenlenen bir zirveye katılırken, siber güvenlik alanında çalışan bir arkadaşına, ekibinin sentetik seslerle yaptığı deneylerin hayal kırıklığı yarattığını söyledi.

"Zihinsel sağlık modellerimiz için eğitimi geliştirmek amacıyla sentetik verileri araştırıyorduk, ancak üretilen sesler gerçek insan konuşmasından o kadar farklıydı ki, neredeyse %100 oranında bunu anlayabiliyorduk," dedi.

CEO, “Beni durdurdu ve 'Grace, bu güvenlikte çözülmüş bir sorun değil' dedi. İşte o an her şey yerine oturdu. O zamandan beri, güvenlik, finansal hizmetler ve telekomünikasyon şirketleriyle yaptığımız görüşmeler, deepfake ses saldırılarının ne kadar hızlı arttığını ve canlı görüşmelerde insan sesini sentetik seslerden ayırt etme ihtiyacının ne kadar gerçek olduğunu doğruladı” diye ekledi.

Geçen yıl Nisan ayında FBI uyardı ABD'li üst düzey yetkililerden geliyormuş gibi görünen ve eski hükümet çalışanlarını ve onların bağlantılarını hedef alan kötü amaçlı bir kısa mesaj ve sesli mesaj kampanyası yürütülüyordu. ABD'deki büyük ulusal bankalar da bu kampanyadan etkilenmişti. Hedeflenen Günlük ortalama 5.5 ses manipülasyonu dolandırıcılık girişimiyle ve Vanderbilt Üniversitesi Tıp Merkezi'ndeki hastane personeliyle ilgili olarak... rapor Arkadaş, amir ve iş arkadaşı gibi davranan taklitçiler tarafından gerçekleştirilen vishing saldırıları.

Bununla birlikte, deepfake teknolojisi başlangıçta Kintsugi'nin çalışmalarında yer almıyordu. Şirket ekibi, çağrı merkezi çalışanları ve dış aramalar için sentetik seslerle denemeler yapmak üzere Cartesia, Sesame ve ElevenLabs gibi hazır modeller kullanıyor olsa da, Sora gibi modellerin yer aldığı kalabalık ve erişilebilir bir pazarda deepfake sahtekarlığı odak noktaları değildi.

Sesin gerçekliğini gösteren insan düzeyindeki sinyaller, aslında bir insanı insan yapan biyolojik işaretlerle aynıdır. Dil veya anlamdan bağımsız olarak, Kintsugi Voice, sinyal işleme ve konuşmanın fiziksel gecikmesiyle çalışarak, konuşmanın nasıl üretildiğini yansıtan ince zamanlama, prozodik değişkenlik, bilişsel yük ve fizyolojik işaretleri yakalar... ne söylendiğini değil.

Chang, "Sentetik sesler akıcı gelebilir, ancak aynı biyolojik ve bilişsel unsurları taşımazlar" dedi. Şirketin modeli, yalnızca 3 ila 5 saniyelik ses kullanarak tespit doğruluğunda sürekli olarak en üst %10'luk dilimde yer alıyor.

Kintsugi, özellikle profesyonel tedaviye ulaşmanın zaman ve kaynak gerektirdiği alanlarda, ruh sağlığı sorunlarıyla mücadele edenler için devrim niteliğinde olabilir. Aynı şekilde, teknolojisi derin sahtecilik tespiti ve genel olarak siber güvenlik için de bir devrim niteliği taşıyor: derin sahtecilik tanıma yerine orijinallik tespiti.

Gelecek, İnsan Odaklı Teknolojide Yatıyor

Siber güvenlik uzun zamandır teknolojilerin kötü amaçlı kullanımına veya faillerin kendisine odaklanmıştır. Ancak Kintsugi'nin tesadüfi keşfi, insanlığın kendisine yönelik bir risk almaktadır.

Chang, “Tamamen farklı bir yüzey alanında çalışıyoruz: insan özgünlüğünün kendisi. LLM'ler, LLM tarafından oluşturulan içeriği güvenilir bir şekilde tespit edemez ve yapay nesne tabanlı yöntemler kırılgandır. Gerçek insan değişkenliğini kodlayan büyük, klinik olarak etiketlenmiş veri kümelerini yakalamak pahalı, yavaş ve çoğu güvenlik şirketinin temel uzmanlık alanının dışındadır; bu da bu yaklaşımı tekrarlamayı zorlaştırır,” diye belirtti.

Girişimin yaklaşımı, daha geniş bir değişime de işaret ediyor: alanlar arası inovasyon. Sağlık sektöründeki öncüler, yapay zeka destekli sesli kimlik avı tespitinde öncülük edebilir; uzay teknolojisindeki yenilikçiler yeni acil müdahale mekanizmalarını destekleyebilir veya oyun geliştiricileri mimari ve şehir planlamasına katkıda bulunabilir.

Chang ise, sesli etkileşimler yoluyla gerçek insanları ve nihayetinde gerçek niyetleri doğrulamak için bir standart haline gelmeyi planlıyor.

"HTTPS'nin web için varsayılan güven katmanı haline gelmesi gibi, 'insan doğrulaması'nın da ses tabanlı sistemler için temel bir katman haline geleceğine inanıyoruz. Signal, bu altyapının başlangıcıdır," dedi.

Üretken yapay zekanın hız kazanmaya devam etmesiyle birlikte, en etkili koruma önlemleri, insanları insan yapan şeyin ne olduğunu anlamaktan gelebilir.

İlgili konular:deepfake derin sahte algılama ruh sağlığı

Salome Beyer Velez

Salomé, Medellín doğumlu bir gazeteci ve Espacio Media Incubator'da Kıdemli Muhabirdir. Tarih ve Politika alanında bir geçmişe sahip olan Salomé'nin çalışmaları, ortaya çıkan teknolojilerin toplumsal önemini vurgular. Diğerlerinin yanı sıra Al Jazeera, Latin America Reports ve The Sociable'da yer aldı.