KĂŒnstliche Intelligenz
Modell fĂŒr maschinelles Lernen misst die Leistungen von MLB-Spielern

Ein Forscherteam am Penn State College of Information Sciences and Technology hat ein Modell fĂŒr maschinelles Lernen entwickelt, mit dem sich die kurz- und langfristige Leistung von Baseballspielern und -teams besser messen lĂ€sst. Die neue Methode wurde mit bestehenden statistischen Analysemethoden namens Sabermetrics verglichen.
Die Forschung wurde in einem Artikel mit dem Titel âUsing Machine Learning to Describe How Players Impact the Game in the MLBâ vorgestellt.
Aufbauend auf NLP und Computer Vision
Der Ansatz des Teams stĂŒtzte sich auf die jĂŒngsten Fortschritte in der Verarbeitung natĂŒrlicher Sprache und der Computervision und könnte groĂe Auswirkungen auf die Art und Weise haben, wie der Einfluss des Spielers auf das Spiel gemessen wird.
Connor Heaton ist Doktorand am College of IST.
Heaton sagt, dass die bestehende Methodenfamilie darauf basiert, wie oft ein Spieler oder eine Mannschaft ein bestimmtes Ereignis erreicht, beispielsweise einen Homerun. Diese Methoden berĂŒcksichtigen nicht den Kontext jeder Aktion.
âStellen Sie sich ein Szenario vor, in dem ein Spieler bei seinem letzten Plattenauftritt eine Single aufgenommen hatâ, sagte Heaton. âEr hĂ€tte ein Dribbling an der dritten Baselinie ausfĂŒhren können, einen LĂ€ufer von der ersten zur zweiten Base vorrĂŒcken lassen und den Wurf zur ersten Base schlagen können, oder er hĂ€tte einen Ball tief ins linke Feld schlagen und bequem die erste Base erreichen können, aber er hatte nicht die Geschwindigkeit, um darauf zu drĂ€ngen ein DoppelgĂ€nger. Die Beschreibung beider Situationen als âeine einzigeâ ist zutreffend, erzĂ€hlt aber nicht die ganze Geschichte.â
Das neue Modell
Heatons Modell basiert auf dem Erlernen der Bedeutung von Ereignissen im Spiel, die auf der Auswirkung, die sie auf das Spiel und ihren Kontext haben, basiert. Das Modell betrachtet das Spiel dann als eine Abfolge von Ereignissen, um numerische Darstellungen darĂŒber auszugeben, wie Spieler das Spiel beeinflussen.
âWir reden oft ĂŒber Baseball im Sinne von âDieser Spieler hatte gestern zwei Einzel und ein Doppelâ.â oder âEr ging eins zu vierâ, sagte Heaton. âViele der Arten, wie wir ĂŒber das Spiel sprechen, fassen die Ereignisse lediglich in einer zusammenfassenden Statistik zusammen. âUnsere Arbeit versucht, ein ganzheitlicheres Bild des Spiels zu zeichnen und eine differenziertere, rechnerische Beschreibung darĂŒber zu erhalten, wie Spieler das Spiel beeinflussen.â
Die neue Methode nutzt sequentielle Modellierungstechniken im NLP, um Computern das Erlernen der Bedeutung verschiedener Wörter zu ermöglichen. Heaton nutzte dies, um seinem Modell die Bedeutung von Ereignissen im Baseballspiel beizubringen, beispielsweise wenn ein Schlagmann einen Single schlÀgt. Das Spiel wurde dann als Abfolge von Ereignissen modelliert.
âDie Wirkung dieser Arbeit ist der Rahmen, der fĂŒr das vorgeschlagen wird, was ich gerne als âBefragung des Spielsâ bezeichneâ, sagte Heaton. âWir betrachten es als eine Sequenz in diesem gesamten RechengerĂŒst zur Modellierung eines Spiels.â
Das Modell ist in der Lage, den Einfluss eines Spielers auf das Spiel kurzfristig zu beschreiben und in Kombination mit herkömmlichen Methoden den Gewinner eines Spiels mit einer Genauigkeit von ĂŒber 59 % vorherzusagen.
Das Modell trainieren
Die Forscher trainierten ihr Modell anhand von Daten, die zuvor von Systemen gesammelt wurden, die in Baseballstadien der Major League installiert waren. Diese Systeme verfolgen detaillierte Informationen zu jedem Spielfeld, einschlieĂlich Spielerpositionierung, Belegung des Spielfelds und Spielfeldgeschwindigkeit. Es wurden zwei Arten von Daten verwendet. Das erste waren Tonhöhendaten, die dabei halfen, Informationen wie den Tonhöhentyp zu analysieren. Bei der zweiten handelte es sich um Saison-fĂŒr-Saison-Daten, die zur Untersuchung positionsspezifischer Informationen verwendet wurden.
Jeder Pitch innerhalb des gesammelten Datensatzes wies drei Hauptmerkmale auf: das spezifische Spiel, die At-Bat-Nummer innerhalb des Spiels und die Pitch-Nummer innerhalb des At-Bat. Mithilfe dieser Daten konnten die Forscher die Abfolge der Ereignisse rekonstruieren, die ein MLB-Spiel ausmachen.
Um die Ereignisse zu beschreiben, wie sie passierten und wer an jedem Spielzug beteiligt war, identifizierte das Team 325 mögliche SpielÀnderungen, die auftreten können, wenn ein Wurf geworfen wird. Diese wurden dann mit vorhandenen Daten kombiniert und Spielerrekorde wurden unterstellt.
Prasenjit Mitra ist Professor fĂŒr Informationswissenschaften und Technologie sowie Mitautor des Artikels.
âDiese Arbeit hat das Potenzial, den Stand der Technik in der Sabermetrik erheblich voranzutreibenâ, sagte Prof. Mitrae. âNach unserem besten Wissen sind wir die ersten, die einen differenzierten Zustand des Spiels erfassen und darstellen und diese Informationen als Kontext nutzen, um die einzelnen Ereignisse zu bewerten, die von traditionellen Statistiken gezĂ€hlt werden â zum Beispiel durch die automatische Erstellung eines Modells, das.â versteht SchlĂŒsselmomente und entscheidende Ereignisse.â












