Connect with us

Yapay Zekâ 101

Bilgisayarlı Görüntü Nedir?

mm

Bilgisayarlı Görüntü Nedir?

Bilgisayarlı görüntüleme algoritmaları, şu anda dünyanın en dönüştürücü ve güçlü AI sistemlerinden biridir. Bilgisayarlı görüntüleme sistemleri otonom araçlarda, robot navigasyonunda, yüz tanıma sistemlerinde ve daha fazlasında kullanılır. Ancak, bilgisayar görüntüleme algoritmaları tam olarak nedir? Nasıl çalışırlar? Bu soruları cevaplamak için, bilgisayar görüntülemenin arkasındaki teoriye, bilgisayar görüntüleme algoritmalarına ve bilgisayar görüntüleme sistemlerinin uygulamalarına derinlemesine bakacağız.

Bilgisayarlı Görüntü Sistemleri Nasıl Çalışır?

Bilgisayarlı görüntüleme sistemlerinin nasıl çalıştığını tam olarak takdir edebilmek için, önce insanların nesneleri nasıl tanıdığı konusunda bir dakika konuşalım. Nöropsikolojinin nesne tanıma konusundaki en iyi açıklaması, nesne tanımanın ilk aşamasını, nesnelerin temel bileşenlerinin, such as form, renk ve derinliğin beyin tarafından ilk olarak yorumlandığı bir model olarak tanımlar. Gözden beyine giren sinyaller, nesnenin kenarlarını ilk olarak çıkarmak için analiz edilir ve bu kenarlar daha kompleks bir temsil oluşturmak için bir araya getirilir.
Bilgisayarlı görüntüleme sistemleri, nesnenin kenarlarını ilk olarak belirleyerek ve sonra bu kenarları nesnenin formuna birleştirmek suretiyle, insan görsel sistemi ile çok benzer bir şekilde çalışır. Büyük fark, bilgisayarların görüntüleri sayılar olarak yorumlamasıdır, bu nedenle bir bilgisayar görüntüleme sistemi, görüntüyü oluşturan bireysel pikselleri yorumlamak için bir yol bulmalıdır. Bilgisayarlı görüntüleme sistemi, görüntüdeki piksellere değerler atayacaktır ve bir piksel bölgesinin değerleri ile başka bir piksel bölgesinin değerleri arasındaki farkı inceleyerek, bilgisayar kenarları belirleyebilir. Örneğin, görüntülenen görüntü gri tonlarda ise, değerler siyah (0 ile temsil edilir) ile beyaz (255 ile temsil edilir) arasında olacaktır. Yakın pikseller arasındaki değer aralığında ani bir değişiklik, bir kenarı gösterecektir.
Piksel değerlerini karşılaştırma ilkesi, renkli görüntülerle de yapılabilir, bilgisayar farklı RGB renk kanalları arasındaki farkları karşılaştırır. Şimdi bir bilgisayar görüntüleme sisteminin bir görüntüyü yorumlamak için piksel değerlerini nasıl incelediğini bildiğimize göre, bir bilgisayar görüntüleme sisteminin mimarisine bir göz atalım.

Evrişimli Sinir Ağları (CNN’ler)

Bilgisayarlı görüntüleme görevlerinde kullanılan birincil AI türü, evrişimli sinir ağlarına dayanan bir türdür. Evrişim tam olarak nedir?
Evrişimler, ağın piksel değerleri arasındaki farkı belirlemek için kullandığı matematiksel işlemlerdir. Bir piksel değerleri ızgarasını hayal edin, bu ızgaranın üzerinde daha küçük bir ızgara hareket ettirin. İkinci ızgaranın altında bulunan değerler ağı tarafından analiz edilir, böylece ağ sadece bir avuç pikseli aynı anda inceliyor. Bu genellikle “kaydırma pencereleri” tekniği olarak adlandırılır. Ağ tarafından kaydırma penceresi ile analiz edilen değerler, ağ tarafından özetlenir, bu da görüntünün karmaşıklığını azaltmaya ve ağın desenleri çıkarmasını kolaylaştırır.
Evrişimli sinir ağları, iki farklı bölüme ayrılmıştır: evrişimli bölüm ve tam bağlantılı bölüm. Ağın evrişimli katmanları, özellik çıkarıcılarıdır ve their görevi, görüntüdeki pikselleri analiz etmek ve bunları tam bağlantılı katmanların öğrenmek için desen çıkarmasını sağlayan temsilciler oluşturmaktır. Evrişimli katmanlar, ilk olarak sadece pikselleri inceleyerek ve görüntünün düşük seviyeli özelliklerini, such as kenarlar gibi, çıkarmaya başlar. Daha sonraki evrişimli katmanlar, kenarları daha kompleks şekillere birleştirir. Sonunda, ağın, kenarları ve görüntünün ayrıntılarını temsil eden bir temsili olması umulmaktadır ve bu temsili, tam bağlantılı katmanlara iletebilir.

Görüntü İşaretleme

Bir evrişimli sinir ağı, kendi başına görüntülerden desen çıkarmak için kullanılabilir, ancak bilgisayar görüntüleme sisteminin doğruluğu, görüntüleri işaretlemek suretiyle büyük ölçüde iyileştirilebilir. Görüntü işaretleme, sınıflandırıcıya görüntüdeki önemli nesneleri tespit etmesine yardımcı olan meta verileri görüntüye eklemek için kullanılan bir işlemdir. Görüntü işaretleme, bilgisayar görüntüleme sistemlerinin yüksek doğrulukta olması gerektiği durumlarda, örneğin bir otonom aracı veya robotu kontrol ederken, önemlidir.
Görüntüleri, bilgisayar görüntüleme sınıflandırıcısının performansını iyileştirmek için çeşitli şekillerde işaretlemek mümkündür. Görüntü işaretleme, genellikle hedef nesneyi çevreleyen bir kutu olan sınırlayıcı kutular ile yapılır ve bilgisayara, kutu içinde odaklanmasını söyler. Anlamsal segmentasyon, bir başka tür görüntü işaretleme yöntemidir ve bir görüntüdeki her bir piksele bir görüntü sınıfı atamak suretiyle çalışır. Diğer bir deyişle, “çim” veya “ağaçlar” olarak düşünülebilecek her bir piksel, bu sınıflara ait olarak etiketlenir. Bu teknik, piksel düzeyinde kesinlik sağlar, ancak anlamsal segmentasyon açıklamalarını oluşturmak, basit sınırlayıcı kutular oluşturmaktan daha karmaşıktır ve zaman alıcıdır. Diğer işaretleme yöntemleri, such as çizgiler ve noktalar, da mevcuttur.

Blog yazarı ve programcı, Machine Learning ve Deep Learning konularında uzmanlık sahibi. Daniel, başkalarının AI'nin gücünü sosyal fayda için kullanmasına yardımcı olmak umudu taşıyor.