Artificial Intelligence

Machine Learning-model meet de prestaties van MLB-spelers

Bijgewerkt on 9 december 2022

Een team van onderzoekers van het Penn State College of Information Sciences and Technology heeft een machine learning-model ontwikkeld dat de prestaties van honkbalspelers en teams op de korte en lange termijn beter kan meten. De nieuwe methode werd afgemeten aan bestaande statistische analysemethoden, sabermetrics genaamd.

Het onderzoek werd gepresenteerd in een paper met de titel "Machinaal leren gebruiken om te beschrijven hoe spelers het spel in de MLB beïnvloeden."

Voortbouwend op NLP en Computer Vision

De aanpak van het team was gebaseerd op recente ontwikkelingen op het gebied van natuurlijke taalverwerking en computervisie, en zou grote gevolgen kunnen hebben voor de manier waarop de impact van de speler op het spel wordt gemeten.

Connor Heaton is een promovendus aan het College of IST.

Heaton zegt dat de bestaande familie van methoden afhankelijk is van het aantal keren dat een speler of team een afzonderlijke gebeurtenis behaalt, zoals het slaan van een homerun. Deze methoden houden geen rekening met de context van elke actie.

"Denk eens aan een scenario waarin een speler een honkslag opnam tijdens zijn laatste plaatoptreden", zei Heaton. "Hij had een dribbel langs de derde honklijn kunnen slaan, een loper van de eerste naar de tweede kunnen opschuiven en de aangooi naar de eerste kunnen verslaan, of een bal naar diep links kunnen slaan en comfortabel het eerste honk kunnen bereiken, maar hij had niet de snelheid om aan te dringen." een dubbele. Het beschrijven van beide situaties als resulterend in 'een enkele' is juist, maar vertelt niet het hele verhaal."

Het nieuwe model

Het model van Heaton is gebaseerd op het leren van de betekenis van in-game-gebeurtenissen, die is gebaseerd op de impact die ze hebben op het spel en hun context. Het model ziet het spel vervolgens als een opeenvolging van gebeurtenissen om numerieke representaties uit te voeren van hoe spelers het spel beïnvloeden.

“We praten vaak over honkbal in termen van 'deze speler had gisteren twee singles en een double.' of 'hij ging één voor vier', zei Heaton. “Veel van de manieren waarop we over de game praten, vatten de gebeurtenissen gewoon samen met één samenvattende statistiek. "Ons werk probeert een meer holistisch beeld van het spel te krijgen en een meer genuanceerde, computationele beschrijving te krijgen van hoe spelers het spel beïnvloeden."

De nieuwe methode maakt gebruik van sequentiële modelleringstechnieken in NLP om computers in staat te stellen de betekenis van verschillende woorden te leren. Heaton gebruikte dit om zijn model de betekenis te leren van gebeurtenissen in het honkbalspel, zoals een slagman die een honkslag slaat. Het spel werd vervolgens gemodelleerd als een opeenvolging van gebeurtenissen.

"De impact van dit werk is het raamwerk dat wordt voorgesteld voor wat ik graag 'het spel ondervragen' noem," zei Heaton. "We zien het als een reeks in deze hele computationele steiger om een spel te modelleren."

Het model is in staat om de invloed van een speler op het spel op korte termijn te beschrijven, en in combinatie met traditionele methoden kan het de winnaar van een spel voorspellen met een nauwkeurigheid van meer dan 59%.

Het model trainen

De onderzoekers trainden hun model door gegevens te gebruiken die eerder waren verzameld van systemen die waren geïnstalleerd in honkbalstadions van de Major League. Deze systemen houden gedetailleerde informatie bij voor elk veld, inclusief de positionering van de speler, de basisbezetting en de snelheid van het veld. Er zijn twee soorten gegevens gebruikt. De eerste was pitch-by-pitch-gegevens, die hielpen bij het analyseren van informatie zoals het pitch-type. De tweede was seizoen-voor-seizoen data, gebruikt om positie-specifieke informatie te onderzoeken.

Elke worp binnen de verzamelde dataset had drie belangrijke kenmerken, namelijk het specifieke spel, het slagbeurtnummer binnen de wedstrijd en het worpnummer binnen de slagbeurt. Met deze gegevens konden de onderzoekers de reeks gebeurtenissen reconstrueren waaruit een MLB-game bestaat.

Om de gebeurtenissen te beschrijven die hebben plaatsgevonden, hoe ze zijn gebeurd en wie bij elk spel betrokken was, identificeerde het team 325 mogelijke spelveranderingen die kunnen optreden wanneer een worp wordt gegooid. Dit werd vervolgens gecombineerd met bestaande gegevens en spelersrecords werden geïmputeerd.

Prasenjit Mitra is hoogleraar informatiewetenschappen en -technologie en co-auteur van het artikel.

"Dit werk heeft het potentieel om de stand van de techniek in sabermetrie aanzienlijk te verbeteren", zei prof. Mitrae. "Voor zover wij weten, is de onze de eerste die een genuanceerde staat van het spel vastlegt en weergeeft en deze informatie gebruikt als context om de individuele gebeurtenissen te evalueren die worden geteld door traditionele statistieken - bijvoorbeeld door automatisch een model te bouwen dat begrijpt sleutelmomenten en koppelingsgebeurtenissen.

Gerelateerde onderwerpen:AI kunstmatige intelligentie sport-

AI blijkt het leren en de betrokkenheid in wetenschapsmusea te vergroten

Mis het niet

Deepfake-detectie op basis van originele menselijke biometrische kenmerken

Alex McFarland

Alex McFarland is een AI-journalist en -schrijver die de nieuwste ontwikkelingen op het gebied van kunstmatige intelligentie onderzoekt. Hij heeft samengewerkt met tal van AI-startups en publicaties over de hele wereld.