Yapay Zekâ

Araştırmacılar AI’ı Kullanarak Yansımaların Orijinal Görüntülerden Nasıl Farklı Olduğunu Araştırıyor

Published July 5, 2020

Updated April 28, 2026

Daniel Nelson

Cornell Üniversitesi’ndeki araştırmacılar yakın zamanda, görüntülerin yansımalarının orijinal görüntülerden nasıl farklı olduğunu araştırmak için makine öğrenimi sistemlerini kullandılar. ScienceDaily tarafından bildirildiği üzere, araştırmacı ekibinin oluşturduğu algoritmalar, bir görüntünün.flip veya yansıtıldığını gösteren ipuçları, orijinal görüntüden farklılıklar olduğunu buldu.

Cornell Tech’te bilgisayar bilimi yardımcı doçenti olan Noah Snavely, çalışmanın kıdemli yazarıydı. Snavely’ye göre, araştırma projesi, araştırmacıların görüntülerin hem açık hem de ince yollarla yansıtıldığında nasıl farklı olduğunu merak ettiğinde başladı. Snavely, ilk bakışta çok simetrik görünen şeylerin genellikle bir yansıma olarak ayırt edilebileceğini açıkladı. “Yeni yollarla bilgi edinmeyle neler keşfedebileceğime şaşıyorum” dedi Snavely, ScienceDaily’e göre.

Araştırmacılar, algoritmalarını eğitmek için insan görüntülerine odaklandılar. Bu, yüzlerin açıkça asimetrik görünmediği için yapıldı. Flipped görüntüleri orijinal görüntülerden ayırt etmek için eğitilen AI, çeşitli görüntü türleri boyunca %60-%90 arasında bir doğruluk oranı elde etti.

AI’nın öğrendiği bir flipped görüntünün görsel özelliklerinin çoğu oldukça ince ve insanların flipped görüntülere baktıklarında bunları ayırt etmesi zordur. AI’nın flipped ve orijinal görüntüler arasında ayrım yaparken kullandığı özellikleri daha iyi yorumlamak için araştırmacılar bir ısı haritası oluşturdular. Isı haritası, AI’nın odaklandığı görüntünün bölgelerini gösterdi. Araştırmacılara göre, AI’nın flipped görüntüleri ayırt etmek için kullandığı en yaygın ipuçlarından biri metindi. Bu şaşırtıcı değildi ve araştırmacılar, flipped ve orijinal görüntüler arasındaki daha ince farklılıkları daha iyi anlamak için eğitim verilerini metin içeren görüntülerden çıkardı.

Metin içeren görüntüler eğitim kümesinden çıkarıldıktan sonra, araştırmacılar AI sınıflandırıcının görüntülerin özelliklerine, seperti gömlek kolları, cep telefonları, kol saatleri ve yüzler gibi özelliklere odaklandığını buldu. Bu özelliklerin bazıları, insanların genellikle cep telefonlarını sağ ellerinde taşıdığı ve gömlek kollarındaki düğmelerin genellikle sol tarafta olduğu gibi açık ve güvenilir desenler içerir. Ancak yüz özelliklerinin genellikle çok simetrik olduğu ve farklılıkların küçük ve insan gözlemcisi tarafından tespit edilmesi zor olduğu gerçeğine karşın.

Araştırmacılar, AI’nın odaklandığı yüz bölgelerini vurgulayan başka bir ısı haritası oluşturdular. AI genellikle insanların gözleri, saçları ve sakallarını flipped görüntüleri tespit etmek için kullanıyordu. İnsanların fotoğrafları çekilirken slightly sol tarafa baktıkları için nedenler bilinmemekle birlikte, araştırmacılar insanların ellerinin hangi tarafını kullandıklarının, tıraş veya tarak gibi şekillerde ortaya çıkabileceğini teorileştiriyorlar. Bu göstergelerin güvenilmez olabileceği halde, birden fazla göstergenin birleştirilmesi, araştırmacıların daha fazla güven ve doğruluk elde etmesine yardımcı olabilir.

Bu doğrultuda daha fazla araştırma yapılması gerekiyor, ancak bulgular tutarlı ve güvenilir ise, bu, araştırmacıların makine öğrenimi algoritmalarını daha verimli bir şekilde eğitmek için yollar bulmasına yardımcı olabilir. Bilgisayarlı görüntüleme AI genellikle yansımalar kullanılarak eğitilir, çünkü bu, mevcut eğitim verilerini artırmak için etkili ve hızlı bir yoldur. Yansıtılmış görüntülerin nasıl farklı olduğunu analiz etmek, makine öğrenimi araştırmacılarının, makine öğrenimi modellerindeki önyargıları daha iyi anlamalarına ve görüntüleri yanlış şekilde sınıflandırmasına yardımcı olabilir.

Snavely, ScienceDaily’e göre şöyle demiştir:

“Bilgisayarlı görüntüleme topluluğu için açık bir soru ortaya çıkıyor, yani verilerinizi artırmak için bu.flip işlemini ne zaman yapabilirsiniz ve ne zaman yapamazsınız? İnsanların bu sorular hakkında daha fazla düşünmesini ve algoritmaları nasıl önyargıladığını anlamak için araçlar geliştirmeye başlamalarını umuyorum.”

Daniel Nelson

Blog yazarı ve programcı, Machine Learning ve Deep Learning konularında uzmanlık sahibi. Daniel, başkalarının AI'nin gücünü sosyal fayda için kullanmasına yardımcı olmak umudu taşıyor.

Unite.AI

Araştırmacılar AI’ı Kullanarak Yansımaların Orijinal Görüntülerden Nasıl Farklı Olduğunu Araştırıyor

You may like