Yapay Zekâ
AI Modeli Bulanık Görüntüleri 60 Kat Arttırabilir

Duke Üniversitesi’nden araştırmacılar, yüksek derecede bulanık ve pikselli görüntüleri yüksek detayla 렌더 edebilen bir AI modeli geliştirdiler. TechXplore’a göre, model görece az pikseli alıp görüntüleri büyüterek yaklaşık olarak orijinal görüntünün 64 katı çözünürlüğe sahip gerçekçi yüzler oluşturabiliyor. Model, orijinal görüntünün satırları arasındaki özellikleri hayal ediyor veya hayal ediyor.
Bu araştırma süper çözünürlük örneğidir. Duke Üniversitesi bilgisayar bilimi ekibinden Cynthia Rudin, TechXplore’a açıkladığı gibi, bu araştırma projesi süper çözünürlük için bir rekor teşkil ediyor, çünkü daha önce hiç bu kadar az piksel örneğinden bu kadar gerçekçi görüntüler oluşturulmamıştı. Araştırmacılar, modelin aslında orijinal düşük kaliteli görüntüdeki kişinin yüzünü yeniden yaratmadığını vurguladılar. Bunun yerine, model yeni yüzler oluşturur ve önce orada olmayan detayları doldurur. Bu nedenle, model güvenlik sistemleri gibi şeylerde kullanılamaz, çünkü odak dışı görüntüleri gerçek bir kişiye dönüştüremez.
Geleneksel süper çözünürlük teknikleri, yüksek çözünürlüklü bir görüntüye dönüştürmek için gereken pikseller hakkında tahminlerde bulunarak çalışır, daha önce öğrendikleri görüntülere dayanarak. Eklenen pikseller tahminlerin sonucudur, bu nedenle tüm pikseller çevrelerindeki piksellerle eşleşmeyecektir ve görüntünün belirli bölgeleri bulanık veya çarpık görünebilir. Duke Üniversitesi’nden araştırmacılar, AI modelini eğitmek için farklı bir yöntem kullandılar. Duke araştırmacıları tarafından oluşturulan model, önce düşük çözünürlüklü görüntüleri alır ve zamanla görüntüye detay ekler, yüksek çözünürlüklü AI tarafından oluşturulan yüzleri örnek olarak referans alır. Model, AI tarafından oluşturulan yüzleri referans alır ve hedef görüntüye benzeyenleri bulmaya çalışır, oluşturulan yüzler hedef görüntüye göre küçültülür.
Araştırma ekibi, yeni görüntüler oluşturmak için bir Generative Adversarial Network (GAN) modeli oluşturdu. GAN’ler aslında aynı veri kümesiyle eğitilen ve birbirlerine karşı yarışan iki sinir ağıdır. Bir ağ, gerçek görüntülere benzeyen sahte görüntüler oluşturmakla sorumludur, ikinci ağ ise sahte görüntüleri gerçeklerden ayırmakla sorumludur. İlk ağ, görüntülerinin sahte olarak tanımlanması durumunda bilgilendirilir ve gerçek görüntülerden ayırt edilemeyecek kadar iyileştirilir.
Araştırmacılar, süper çözünürlük modeline PULSE adını verdiler ve model, diğer süper çözünürlük yöntemlerinin yüksek kaliteli görüntüler oluşturamadığı çok bulanık görüntülere bile tutarlı olarak yüksek kaliteli görüntüler üretir. Model, yüz özelliklerinin neredeyse ayırt edilemediği görüntülerden bile gerçekçi yüzler oluşturabiliyor. Örneğin, 16×16 çözünürlüklü bir yüz görüntüsü verildiğinde, 1024 x 1024 görüntü oluşturabiliyor. Bu süreçte bir milyondan fazla piksel eklenerek, saç telleri, kırışıklıklar ve hatta aydınlatma gibi detaylar dolduruluyor. Araştırmacılar, 1440 PULSE tarafından oluşturulan görüntüleri diğer süper çözünürlük teknikleriyle oluşturulan görüntülerle karşılaştırdıklarında, PULSE tarafından oluşturulan görüntüler tutarlı olarak en iyi puanları aldı.
Araştırmacılar, modelini insanların yüzlerine uyguladı, ancak kullandıkları teknikler几乎 herhangi bir nesneye uygulanabilir. Düşük çözünürlüklü çeşitli nesnelerin görüntüleri, bu nesne setinin yüksek çözünürlüklü görüntülerini oluşturmak için kullanılabilir, bu da mikroskopi, uydu görüntüleme, eğitim, imalat ve tıp gibi çeşitli endüstriler ve alanlar için olası uygulamalar açıyor.












