Yapay Zeka
Araştırmacılar Yeni El Hareketi Tanıma Algoritması Geliştiriyor

Sun Yat-sen Üniversitesi'nden Zhiyi Yu liderliğindeki bir araştırma ekibi, karmaşık, doğru ve uygulanabilir yeni bir el hareketi tanıma algoritması geliştirdi.
El hareketleri, insan-bilgisayar etkileşimlerinde giderek daha fazla benimseniyor ve kamera sistemleri, görüntü analizi ve makine öğrenimindeki son gelişmeler, optik tabanlı hareket tanımayı büyük ölçüde geliştirdi. Bununla birlikte mevcut yöntemler, yüksek hesaplama karmaşıklığı, düşük hız, zayıf doğruluk ve az sayıda tanınabilir hareket sınırlamaları nedeniyle birçok zorlukla karşı karşıyadır.
Ekip tarafından geliştirilen yeni algoritma, bu sınırlamaların üstesinden gelmeye çalışıyor ve yayınlanan bir makalede ayrıntılı olarak açıklandı. Elektronik Görüntüleme Dergisi. Ekibin ana hedeflerinden biri, yalnızca bu zorlukların üstesinden gelmekle kalmayan, aynı zamanda tüketici düzeyindeki cihazlarda da kolayca uygulanabilen bir algoritma oluşturmaktı.
Farklı El Tiplerine Uyarlanabilirlik
Algoritmanın en etkileyici yönlerinden biri, farklı el tiplerine uyarlanabilmesidir. Öncelikle kullanıcının el tipini ince, normal veya geniş olarak sınıflandırmaya çalışır. Bunu avuç içi genişliği, avuç içi uzunluğu ve parmak uzunluğu arasındaki ilişkileri hesaba katan üç ölçüme dayanarak yapar.
Başarılı bir sınıflandırmanın ardından, el hareketi tanıma işlemi, giriş hareketini aynı el tipinin saklanan örnekleriyle karşılaştırır.
"Geleneksel basit algoritmalar, farklı el tipleriyle başa çıkamadıkları için düşük tanıma oranlarından muzdarip olma eğilimindedir. Giriş hareketini önce el tipine göre sınıflandırıp ardından bu türle eşleşen örnek kitaplıkları kullanarak, neredeyse ihmal edilebilir bir kaynak tüketimiyle genel tanıma oranını iyileştirebiliriz," diyor Yu.
Ön Tanıma Adımı
Takımın yöntemi ayrıca bir ön tanıma adımını gerçekleştirmek için bir "kısayol özelliğinin" kullanımına da dayanıyor. Tanıma algoritması, dokuz olası hareketten oluşan bir giriş hareketini tanımlayabilir, ancak giriş hareketinin tüm özelliklerini, tüm olası hareketler için saklanan örneklerinkilerle karşılaştırmak son derece zaman alıcıdır.
Bunun üstesinden gelmek için, algoritmanın ön tanıma adımı, olası dokuz hareketten en olası üçünü seçmek için el alanının bir oranını hesaplar. Bu, aday hareketlerin sayısını üçe çıkarır ve son harekete "Hu değişmez anları"na dayanan daha karmaşık ve yüksek hassasiyetli bir özellik çıkarımı ile karar verilir.
Yu, "Hareket ön tanıma adımı yalnızca gerekli hesaplama sayısını ve donanım kaynaklarını azaltmakla kalmıyor, aynı zamanda doğruluktan ödün vermeden tanıma hızını da artırıyor" diyor.
Algoritma, ticari bir PC işlemcisinde ve bir USB kamera kullanılarak bir FPGA platformunda test edildi. Ekip, dokuz el hareketini birden çok kez yapmak için 40 gönüllüyü çağırdı ve sistemin doğruluğunu belirlemek için 40 kişi daha kullanıldı.
Sistem, %93'ün üzerinde bir doğruluk oranıyla el hareketlerini gerçek zamanlı olarak tanıyabildiğini gösterdi. Giriş hareketi görüntüleri döndürüldüğünde, çevrildiğinde veya ölçeklendiğinde bile durum böyleydi.
Araştırmacılar, artık farklı aydınlatma koşullarında algoritmanın performansını iyileştirmenin yanı sıra olası hareket sayısını artırmaya odaklanacaklarını söylüyorlar.