Connect with us

AI Görüntü Hallüsinasyonlarını Onları Abartarak Azaltma

Anderson’un Açısı

AI Görüntü Hallüsinasyonlarını Onları Abartarak Azaltma

mm
A Swami sprays a hallucinated small dragon with RAID bug-spray. SDXL, Flux.1D and Flux Kontext via Krita.

ChatGPT tarzı vizyon modelleri genellikle bir görüntüde bulunmayan öğeleri ‘hayal eder’. Yeni bir yöntem, modeli kendi hayal powerlerinin abartılmış sürümlerini göstererek ve sonra tekrar denemesini isteyerek bu hataları azaltıyor. Bu yaklaşım, yeniden eğitim veya ek veri gerektirmez ve geniş bir model ve model türlerine uygulanabilir.

 

Çin’den yeni bir yayımlanan çalışma, AI tarafından üretilen görüntü ve videolardaki hallüsinasyonlar sorununa ilginç bir bakış açısı sunuyor – kullanıcıların talebi ve girdilerine dayanarak görüntüde明 bulunmayan öğeler.

Aslında, sistem bir görüntüyü alır ve modelin onu tanımlamasına izin verir; sonra bu tanımlamayı yeni bir görüntü oluşturmak için bir metin-görüntü modeli kullanır – ve bu ikinci görüntüdeki ek nesneler veya ayrıntılar, modelin ilk hayal powerlerinin doğrudan temsilcileridir. Sonra, orijinal ve oluşturulan görüntülerin karşılaştırılmasıyla, sistem modeli sonraki denemelerinde bu hatalardan uzaklaştırmaya yönlendirir:

Yeni yöntemin görüntü açıklamalarındaki hallüsinasyonları nasıl tanımladığını ve azalttığını gösteren bir illüstrasyon. Düzenli model, orijinal görüntüde bulunmayan kuşları tanımlar, Böylece onları ekleyen bir yeniden oluşturulmuş görüntü oluşturur. Bu hatalar kırmızıya boyanmıştır. Öte yandan, önerilen yöntem, uydurulmuş ayrıntıları önlerken açıklamayı özel ve akıcı tutar. Kaynak: https://arxiv.org/pdf/2509.21997

Yeni yöntemin görüntü açıklamalarındaki hallüsinasyonları nasıl tanımladığını ve azalttığını gösteren bir illüstrasyon. Düzenli model, orijinal görüntüde bulunmayan kuşları tanımlar, Böylece onları ekleyen bir yeniden oluşturulmuş görüntü oluşturur. Bu hatalar kırmızıya boyanmıştır. Öte yandan, önerilen yöntem, uydurulmuş ayrıntıları önlerken açıklamayı özel ve akıcı tutar. Kaynak: https://arxiv.org/pdf/2509.21997

Yöntem, modelin gerçek görüntüleri tanımlamasıyla başlar ve bazı tanımlamalar, aslında orada olmayan nesneler veya ayrıntılar içerebilir. Bu hayal powerli açıklamalar daha sonra sentetik görüntüler oluşturmak için kullanılır ve bu, hataları daha kolay fark edilir hale getirir. Gerçek ve oluşturulan görüntülerin karşılaştırılmasıyla, sistem modelin hangi iç desenlerin uydurulmuş içeriği üretmeye eğilimli olduğunu öğrenir.

Bu hata desenleri tanımlandıktan sonra, daha sonra kullanılabilir. Model yeni bir görüntüye verildiğinde, sistem internal sinyallerini, bilinen hallüsinasyonlara neden olan desenlerden uzaklaştırmak için ayarlar. Bu işlem, elle ayarlanmış kurallar veya dış veri gerektirmediğinden, tamamen kendini denetleyen kalır.

Makalede şöyle denir:

‘Hallüsinasyonlar MLLM’lerde intrinsik olarak zor tespit edilir çünkü dilbilimsel olarak iyi oluşmuşlardır ve metin düzeyinde güvenilir açıklamalardan ayırt edilemezler. Çelişki, dil olasılığındaki farklılık değil, görsel kanıtlarla uyuşmama olup, model kendisi genellikle buna duyarsızdır. ‘

‘Bunu çözmek için, hallüsinasyon ifşa mekanizması sunuyoruz ve bu, uydurulmuş sinyalleri observable sinyallere dönüştürmek için generatif yeniden yapılandırmayı kullanır.’

Giriş görüntüsü ve açıklaması verildiğinde, sistem FLUX.1-dev metin-görüntü modelini kullanır ve açıklamadan alone bir görüntü oluşturur. Bu yeniden oluşturulan görüntü, açıklamanın anlamını abartma eğilimindedir ve bu, herhangi bir yanlış ayrıntıyı daha belirgin hale getirir. Bu amplifiye edilen hatalar, modelin kendi hatalarını tanımlamasına ve düzeltmesine yardımcı olan faydalı sinyaller olarak hizmet eder.

Yöntemlerini test etmek için, yazarlar açıklamalara hallüsinasyonlar enjekte ettiler ve metin-görüntü modelini kullanarak yeniden oluşturulmuş görüntüler oluşturdular. Bu görüntüler daha sonra LLaVA tarafından yeniden açıklamalandı ve orijinal ve hayal powerli açıklamalar arasındaki anlamsal benzerlik değerlendirildi:

Hallüsinasyon amplifikasyon mekanizmasının nasıl çalıştığını gösteren bir illüstrasyon. Her nokta, orijinal ve yeniden oluşturulmuş görüntülerin açıklamaları arasındaki benzerliği gösterir. Turuncu çizgi, orijinal ve hayal powerli açıklamalar arasındaki benzerliği doğrudan ölçer ve hataları maskelemeye devam eder; mavi çizgi, yeniden yapılandırmadan sonra benzerliği ölçer ve sürecin gizli hallüsinasyonları açık semantic işaretlere dönüştürdüğünü gösterir.

Hallüsinasyon amplifikasyon mekanizmasının nasıl çalıştığını gösteren bir illüstrasyon. Her nokta, orijinal ve yeniden oluşturulmuş görüntülerin açıklamaları arasındaki benzerliği gösterir.

Benzerlik, yeniden yapılandırmadan sonra keskin bir şekilde düşer ve bu, sürecin gizli hataları daha belirgin hale getirdiğini gösterir.

Veri ve Testler

Yeni yöntemin etkinliğini doğrulamak için, üç uygun benchmark kullanıldı: Açıklama Hallüsinasyonu Görüntü İlgili Değerlendirmesi (CHAIR); MLLM Değerlendirme benchmark (MME); ve Havuz Tabanlı Nesne Sorgulama Değerlendirmesi (POPE).

CHAIR yayımlanan çalışmadan örnekler: iki önde gelen açıklama sistemi, TopDown ve NBT, tarafından üretilen hayal powerli nesneler, görüntüde aslında bulunmayan laptoplar, lavabolar veya sörf tahtaları gibi görsel öğeleri içerir. Kaynak: https://arxiv.org/pdf/1809.02156

CHAIR yayımlanan çalışmadan örnekler: iki önde gelen açıklama sistemi, TopDown ve NBT, tarafından üretilen hayal powerli nesneler, görüntüde aslında bulunmayan laptoplar, lavabolar veya sörf tahtaları gibi görsel öğeleri içerir. Kaynak: https://arxiv.org/pdf/1809.02156

Standart metrikler gibi hallüsinasyon oranı veya hatırlama, bir modelin hallüsinasyonlardan kaçınmak için kısa veya belirsiz açıklamalar üretmesi durumunda yanıltıcı olabilir. Hallüsinasyon ve hatırlama arasındaki ticaret için, birleşik bir metrik olan Hallüsinasyon ve Hatırlama (HAR@β) kullanıldı, bu, açıklamaları hem doğruluk hem de tamlikliğe göre puanlar ve dengenin, hatalardan kaçınmak veya daha fazla ayrıntı eklemek daha önemli olup olmadığına bağlı olarak ayarlanmasına izin verir.

POPE, bağlam-duyarlı nesne hallüsinasyonlarını değerlendirmek için kullanıldı ve MME, öznitelik düzeyinde hallüsinasyonları değerlendirmek için kullanıldı, her ikisi de Evet-Hayır kararı görevi olarak çerçevelendi.

Deneyler, çeşitli temsilci veri kümeleri üzerinde, yukarıda bahsedilen Flux modeli ve LLaVA-v1.5-7B varyantı kullanılarak gerçekleştirildi. Kullanılan veri kümeleri Microsoft COCO; A-OKVQA; ve GQA idi.

Gizil düzenleme, modellerin ikinci katmanında, önceki ilgili çalışmaya uygun olarak gerçekleştirildi, mentre hiperparametreler ve sıcaklık tüm modellerde tutarlıydı.

İlk sonuçlar CHAIR için aşağıda sunulmuştur*:

Hallüsinasyon azaltma için CHAIR benchmark performansı, çoklu metrikler kullanılarak değerlendirildi.

Hallüsinasyon azaltma için CHAIR benchmark performansı, çoklu metrikler kullanılarak değerlendirildi.

Bu sonuçlardan, yazarlar şunları belirtir:

‘[Yöntemimiz, CHAIRS ve CHAIRI üzerinde diğer tüm temel modelleri tutarlı bir şekilde geride bırakarak, hallüsinasyonları bastırmadaki üstün etkinliğini gösterir. Ayrıca, neredeyse tüm yöntemlerin, hallüsinasyonları bastırırken hatırlamayı azaltması kaçınılmaz bir ticaret olarak görünse de, yaklaşımımız en küçük düşüşü sağlar. ‘

‘Bu, yöntemimizin geniş bir yelpazede temel nesneleri yakaladığını gösterir. HAR@β metriği ile, yöntemimiz en yüksek puanı alır ve böylece hallüsinasyonları azaltırken kapsamı koruma yeteneğini vurgular.’

Araştırmacılar, bu güçlü sonuçları, temiz semantiklerin orijinal görüntüden güçlendirilmesini ve aynı zamanda yeniden oluşturulmuş görüntüden aldatıcı sinyallerin bastırılmasını sağlayan çift denetimli kurulumuna bağlar. Çünkü ayar, yalnızca hallüsinasyonlarla ilgili yöne hedeflenmiştir, temsilin geri kalanı bozulmadan kalır ve bu da sistemin hataları düzeltmesine, ancak ayrıntı veya bilgililikten ödün vermeden olanak tanır.

POPE benchmark üzerinde çeşitli konfigürasyonlar ve veri kümeleri altında performansa ilişkin karşılaştırma.

POPE benchmark üzerinde çeşitli konfigürasyonlar ve veri kümeleri altında performansa ilişkin karşılaştırma.

POPE üzerindeki sonuçlar hakkında, yukarıdaki sonuç tablosunda belirtilen, makalede şöyle denir:

‘Görülebileceği gibi, yöntemimiz tüm ayarlamalar altında tutarlı bir şekilde en iyi performansı sağlar. Özellikle, yöntemimiz, diğer eğitim-ücretsiz yaklaşımları önemli bir marjla geride bırakarak, ortalama %5.95 doğruluk ve %6.85 F1 puanı elde edebilir. ‘

‘Bu nedenle, bu sonuçlar, yöntemimizin çeşitli zorluk seviyeleri boyunca güvenilir ve genel bir çözüm sunduğunu gösterir.’

Üçüncü test turundan MME üzerinde performans karşılaştırmaları.

Üçüncü test turundan MME üzerinde performans karşılaştırmaları.

Son ana test, MME üzerinde gerçekleştirildi ve sonuçlar yukarıda verildi. Ancak, diğer省kler arasında, ‘OPERA’ yönteminden bahseder, ancak bu, ana makalede veya ekte nowhere tanımlanmamıştır. Yazarlar, MME üzerinde güçlü bir performans iddia etseler de, yeterli tanımlamalar olmadan, sonuç bölümünü burada bırakmak daha uygun olur.

LLaVA-v1.5-7B kullanarak MME benchmarkünden bir illüstrasyon, temel modelin hayal powerli bir cevap üretirken, önerilen yöntemin doğru bir cevap verdiğini ve yeniden oluşturulmuş görüntünün hallüsinasyonu daha belirgin hale getirdiğini gösterir.

LLaVA-v1.5-7B kullanarak MME benchmarkünden bir illüstrasyon, temel modelin hayal powerli bir cevap üretirken, önerilen yöntemin doğru bir cevap verdiğini ve yeniden oluşturulmuş görüntünün hallüsinasyonu daha belirgin hale getirdiğini gösterir.

SONUÇ

Bu makale açıkça aceleyle yazılmış ve son 12 ayda literatürde giderek daha fazla görülen yapı, odak ve açıklık eksikliği sorunlarından muzdariptir (bu, akademik araştırmalarda AI kullanımının hızla artmasıyla ilgili olabilir). Merkez mekanizma, yine de, yenilikçi kalır.

Bu uçtan uca yaklaşım, yeniden eğitim veya ek veri gerektirmediği gibi, çeşitli mimarilere uygulanabilir görünüyor. Daha fazla test adayının görülmesi ilginç olurdu ve ayrıca, böyle bir ara sistemın en azından gecikme ve bazı ek güç gereksinimi getireceği dikkate alınmalıdır – bu, büyük ölçekte küçük bir sorun değildir.

 

* Alışılmadık bir şekilde, bu makalenin ana bölümü, yalnızca ek maddede açıklanan, ancak ana makalede açıklanmayan başlıklarla sonuçlar sunar – literatürde giderek daha fazla görülen bir kötü alışkanlık, araştırmacıların merkezi tezi 8-9 sayfaya sınırlamaya çalıştıkları zaman. Her durumda, hallüsinasyonlu nesnelerin açıklamalarındaki hallüsinasyonları değerlendirmek için kullanılan CHAIR benchmark, daha önceki çalışmadan 500-görüntü MSCOCO alt kümesinden oluşuyordu. İki form kullanıldı: CHAIRs, her açıklamada hallüsinasyonların nasıl ortaya çıktığını ölçen; ve CHAIRI, bahsedilen nesnelerin kaçının hallüsinasyonlu olduğunu ölçen. HAR@β , ana makalede tanımlanan, hallüsinasyon bastırma ve nesne hatırlama kombinasyonunun Fβ-stil bir birleşimidir.

İlk olarak 30 Eylül 2025 Salı günü yayımlandı

Makine öğrenimi üzerine yazar, insan görüntü sentezinde alan uzmanı. Metaphysic.ai'de eski araştırma içeriği başkanı.
Kişisel site: martinanderson.ai
İletişim: [email protected]