Yapay Zekâ
Makine Öğrenimi Modeli MLB Oyuncularının Performansını Ölçüyor

Bilgi Bilim ve Teknoloji Penn State Koleji’ndeki bir araştırma ekibi, baseball oyuncularının ve takımlarının kısa ve uzun vadeli performansını daha iyi ölçebilen bir makine öğrenimi modeli geliştirdi. Yeni yöntem, sabermetrics olarak adlandırılan mevcut istatistiksel analiz yöntemleriyle karşılaştırıldı.
Araştırma, “MLB’de Oyunu Etkileyen Oyuncuları Tanımlamak için Makine Öğrenimi Kullanma” başlıklı bir makalede sunuldu.
Doğal Dil İşleme ve Bilgisayarlı Görüntü İşleme Üzerine Kuruldu
Ekibin yaklaşımı, doğal dil işleme ve bilgisayar görüntüleme alanındaki recent gelişmelere dayanıyordu ve oyuncuların oyun üzerindeki etkisinin ölçülme şekli için büyük sonuçlar doğurabilir.
Connor Heaton, IST Koleji’nde doktora adayı.
Heaton, mevcut yöntemlerin bir oyuncunun veya takımın belirli bir olayı gerçekleştirdiği sayıya dayandığını, ancak her eylemin bağlamını dikkate almadığını söylüyor.
“Bir oyuncunun son plak görünümünde bir tek vuruş kaydettiği bir senaryo düşünün” dedi Heaton. “Üçüncü temel hattına doğru bir top sürerek bir koşucuyu ilk temelden ikinci temelde ilerletebilir ve ilk temelde vuruşu geçebilir veya sol dış saha derinliğine bir top vurup rahatça ilk temelde bulunabilir ancak çift için yeterli hızda olmayabilir. Her iki durumu da ‘tek bir vuruş’ olarak tanımlamak doğru ancak tüm hikayeyi anlatmıyor.”
Yeni Model
Heaton’un modeli, oyun üzerindeki etkilerine ve bağlamına dayalı olarak oyun içi olayların anlamını öğrenmeye dayanır. Model daha sonra oyuncuların oyun üzerindeki etkilerini sayısal olarak temsil etmek için olayların bir dizi olarak görür.
“Bazen baseball hakkında ‘bu oyuncu dün iki tek ve bir çift yaptı’ veya ‘dörtte bir yaptı’ gibi konuşuruz” dedi Heaton. “Oyuncuların oyun üzerindeki etkilerini özetleyen birçok yol, olayları tek bir özet istatistiğiyle özetliyor. Çalışmamız, oyunun daha kapsamlı bir resmini çekmeye ve oyuncuların oyun üzerindeki etkilerini daha nüanslı, hesaplamalı bir şekilde tanımlamaya çalışıyor.”
Yeni yöntem, bilgisayarların farklı kelimelerin anlamını öğrenmesini sağlayan NLP’deki sıralı modelleme tekniklerini kullanıyor. Heaton, bu yöntemi kullanarak modeline bir baseball oyunundaki olayların anlamını öğretti, Örneğin, bir vuruşçunun tek bir vuruş yapması. Oyun daha sonra bir dizi olay olarak modellendi.
“Bu çalışmanın etkisi, ‘oyunu sorgulama’ dediğim şey için önerilen çerçeve” dedi Heaton. “Bunu bir dizi olarak görüyor ve tüm bu hesaplamalı iskelede oyunu modellemek için bir çerçeve oluşturuyoruz.”
Model, bir oyuncunun oyun üzerindeki etkisini kısa vadede tanımlayabiliyor ve geleneksel yöntemlerle birleştirildiğinde, bir oyunun kazananını %59’un üzerinde bir doğrulukla tahmin edebiliyor.
Modeli Eğitime Sokma
Araştırmacılar, büyük lig baseball stadyumlarında kurulan sistemlerden önce toplanan veriler kullanarak modelini eğitti. Bu sistemler, her atış için ayrıntılı bilgi izler, bunlar arasında oyuncu konumu, temel işgali ve atış hızı bulunur. İki tür veri kullanıldı. İlki, atış türünü analiz etmeye yardımcı olan atış bazında veri idi. İkincisi, pozisyon spesifik bilgilerin araştırılması için kullanılan mevsim bazında veri idi.
Toplanan veri kümesindeki her atış, üç önemli özelliğe sahipti: belirli oyun, oyun içindeki atış numarası ve atış içindeki atış numarası. Bu veriler, araştırmacılara bir MLB oyununu oluşturan olayların dizisini yeniden oluşturma olanağı sağladı.
Olayların ne olduğu, nasıl gerçekleştiği ve her oyunun kiminle ilgili olduğu hakkında bilgi vermek için, ekip bir atış atıldığında meydana gelebilecek 325 olası oyun değişikliğini tanımladı. Bu, mevcut verilerle birleştirildi ve oyuncu kayıtları dolduruldu.
Prasenjit Mitra, bilgi bilimleri ve teknoloji profesörü ve makalenin ortak yazarı.
“Bu çalışma, sabermetrics alanındaki durumu önemli ölçüde ilerletebilir” dedi Prof. Mitra. “Bilgimiz dahilinde, bizimki, oyunun nüanslı durumunu yakalayan ve bu bilgileri geleneksel istatistiklerle sayılan bireysel olayları değerlendirmek için bağlam olarak kullanan ilk çalışmadır – örneğin, anahtar anları ve kritik olayları otomatik olarak anlayan bir model oluşturarak.”










