Bizimle iletişime geçin

Yapay Zeka

Araştırmacılar Yapay Zeka Görüntü Üretimini Kontrol Etmek İçin Yeni Yöntem Geliştiriyor

mm
Resim: NC Devlet Üniversitesi

North Carolina Eyalet Üniversitesi'nden araştırmacılar, otonom araçlar gibi alanlarda kullanılabilecek yapay zeka (AI) görüntü üretimini kontrol etmek için yeni bir yöntem geliştirdi.

Koşullu Görüntü Oluşturma ve Diğer Teknikler

Koşullu görüntü oluşturma, kullanıcının talep edebileceği belirli bir dizi koşula dayalı olarak görüntüler oluşturan AI sistemlerini içeren bir AI görevidir. Daha yeni teknikler bunu daha da ileri götürmüş ve kullanıcıların ekranda belirli noktalarda görünmesini istedikleri nesne türlerini belirlemelerini sağlayan bir görüntü düzeni için koşullar içermektedir.

Üniversitedeki araştırmacılar tarafından geliştirilen yeni ve son teknoloji yöntem, tüm bu tekniklerin üzerine inşa ediliyor ve kullanıcıların bir dizi görüntüde belirli özellikleri korurken, görüntüler üzerinde daha fazla kontrole sahip olmalarını sağlıyor.

Tianfu Wu, ortak yazardır. Araştırma kağıdı ve NC State'de bilgisayar mühendisliği yardımcı doçenti. 

Wu, "Yaklaşımımız son derece yeniden yapılandırılabilir," diyor. "Önceki yaklaşımlarda olduğu gibi, bizimki de kullanıcıların sistemin belirli bir dizi koşula dayalı bir görüntü oluşturmasını sağlıyor. Ancak bizimki aynı zamanda bu görüntüyü korumanıza ve ona ekleme yapmanıza olanak tanır. Örneğin, kullanıcılar yapay zekanın bir dağ sahnesi oluşturmasını sağlayabilir. Kullanıcılar daha sonra sistemin o sahneye kayakçı eklemesini sağlayabilir.”

Manipüle Elemanları

Yeni yöntemle kullanıcılar, AI'nın öğeleri bir şekilde hareket ederken veya bir şekilde değişirken tanımlanabilir şekilde aynı olacak şekilde manipüle etmesine de izin verebilir. Böyle bir örnek, AI'nın kayakçıların bir manzara boyunca hareket ederken izleyiciye döndüğü bir dizi görüntü oluşturması olabilir.

Wu, "Bunun için bir uygulama, otonom robotların belirli bir göreve başlamadan önce nihai sonucun nasıl görünebileceğini 'hayal etmelerine' yardımcı olmak olabilir" diyor. "Sistemi yapay zeka eğitimi için görüntüler oluşturmak için de kullanabilirsiniz. Dolayısıyla, dış kaynaklardan görüntüler derlemek yerine, diğer AI sistemlerini eğitmek için görüntüler oluşturmak için bu sistemi kullanabilirsiniz.”

Yeni yaklaşım, COCO-Stuff veri seti ve Visual Genome veri seti ile test edildi ve görüntü kalitesi standartlarına göre, önceki son teknoloji teknikleri geride bıraktı. 

Wu, "Bir sonraki adımımız, bu çalışmayı video ve üç boyutlu görüntülere genişletip genişletemeyeceğimizi görmek," diyor.

Araştırmacılar, yeni yaklaşımı eğitmek için gereken ağır hesaplama gücü göz önüne alındığında 4 GPU'lu bir iş istasyonuna güvenmek zorunda kaldı. Buna rağmen, sistemi dağıtmak hesaplama açısından hala daha az maliyetlidir. 

Wu, "Bir GPU'nun size neredeyse gerçek zamanlı hız sağladığını bulduk" diyor.

"Kağıdımıza ek olarak, bu yaklaşım için kaynak kodumuzu GitHub'da kullanıma sunduk. Bununla birlikte, sektör ortaklarıyla işbirliğine her zaman açığız.”

Alex McFarland, yapay zekadaki en son gelişmeleri araştıran bir yapay zeka gazetecisi ve yazarıdır. Dünya çapında çok sayıda yapay zeka girişimi ve yayınıyla işbirliği yaptı.