Yapay Zekâ

Çok Modlu Öğrenme AI Geliştiricileri Arasında Önem Kazanıyor

Published November 24, 2019

Updated April 5, 2026

Ljubinko Zivkovic

Venture Beat (VB) yapay zeka geliştirilmesinde çok modlu öğrenmenin avantajlarına ilişkin haftalık raporlarının birini ayırdı. their prompt report tarafından ABI Research tarafından yapılan bir rapordu.

Ana kavram, “veri kümelerinin AI sistemlerinin temel yapı taşları olduğu” ve veri kümeleri olmadan “modellerin tahminlerini bilgilendiren ilişkileri öğrenemeyecekleri” gerçeğinde yatmaktadır. ABI raporuna göre “AI cihazlarının toplam kurulmuş tabanı 2019’da 2.69 milyar iken 2024’te 4.47 milyar olacak, ancak kısa vadede bunlardan çok azı birbirleriyle etkileşimli olacaktır.”

Bu, önemli miktarda zaman, enerji ve kaynak israfı anlamına gelebilir, “onların aracılığıyla akan gigabaytların veya petabaytların veri kümesini tek bir AI modeli veya çerçevesine birleştirmek yerine, bağımsız ve heterojen bir şekilde çalışacaklar ve onlara verilen verilerin anlamını çıkarmaya çalışacaklar.”

Bunu aşmak için ABI, çok modlu öğrenme yöntemini öneriyor, bu yöntem çeşitli sensörlerden ve girişlerden veri “tek bir sisteme konsolide edebilir. Çok modlu öğrenme, genellikle yalnızca öğrenme sürecine dahil edildiklerinde açıkça görünen tamamlayıcı bilgiler veya eğilimler taşıyabilir.”

VB, resimler ve metin altyazılarını dikkate alan geçerli bir örnek sunuyor. “Eğer farklı kelimeler benzer resimlerle eşleştirilirse, bu kelimelerin muhtemelen aynı şeyler veya nesneleri tanımlamak için kullanıldığı anlamına gelir. Buna karşılık, bazı kelimeler farklı resimlerin yanında görünürse, bu, bu resimlerin aynı nesneyi temsil ettiği anlamına gelir. Buna göre, bir AI modelinin metin açıklamalarından resim nesnelerini tahmin etmesi mümkün olmalıdır ve gerçekten de akademik literatürün bunu kanıtladığı durumlar vardır.”

Mümkün avantajlara rağmen, ABI, IBM, Microsoft, Amazon ve Google gibi teknoloji devlerinin hala büyük ölçüde tek modlu sistemlere odaklandıklarını belirtiyor. Bunun nedenlerinden biri, böyle bir değişimin temsil ettiği zorluklar.

Ancak, ABI araştırmacıları, “gönderilen cihazların toplam sayısının 2017’de 3.94 milyondan 2023’te 514.12 milyona çıkmasını bekliyorlar, bu durum robotik, tüketici, sağlık hizmetleri ve medya ve eğlence segmentlerindeki benimseme ile teşvik ediliyor.” Çok modlu öğrenmeyi zaten uygulayan şirketler arasında Waymo‘yu örnek gösteriyorlar, Waymo böyle yaklaşımları “hiper-duyarlı otonom araçlar” inşa etmek için kullanıyor ve Intel Labs, şirketin mühendislik ekibinin “gerçek dünya ortamlarında sensör verisi toplama tekniklerini” araştırıyor.

Intel Labs baş mühendisi Omesh Tickoo, VB’ye “ne yaptığımız, zaman gibi bir bağlamı belirleme tekniklerini kullanarak, bir sensörün verisinin en yüksek kalitede olmadığını söyleyen bir sistem inşa ettik. Bu güven değeri verildiğinde, farklı sensörleri farklı aralıklarda birbirlerine karşı tartıyor ve aradığımız cevabı elde etmek için doğru karışımı seçiyor” dedi.

VB, tek modlu öğrenmenin, resim tanıma ve doğal dil işleme gibi uygulamalarda yüksek oranda etkili olduğu yerlerde hakim kalacağını belirtiyor. Aynı zamanda, “elektroniklerin daha ucuz hale gelmesi ve hesaplamaların daha ölçeklenebilir hale gelmesiyle, çok modlu öğrenmenin sadece daha da önemli hale geleceğini” öngörüyor.