Künstliche Intelligenz
Machine-Learning-Modell misst die Leistungen von MLB-Spielern

Ein Team von Forschern am Penn State College of Information Sciences and Technology hat ein Machine-Learning-Modell entwickelt, das die Leistungen von Baseballspielern und -teams sowohl kurzfristig als auch langfristig besser messen kann. Die neue Methode wurde im Vergleich zu bestehenden statistischen Analysemethoden, die als Sabermetrik bezeichnet werden, gemessen.
Die Forschung wurde in einem Paper mit dem Titel „Using Machine Learning to Describe How Players Impact the Game in the MLB“ vorgestellt.
Aufbau auf NLP und Computer Vision
Der Ansatz des Teams basierte auf jüngsten Fortschritten in der natürlichen Sprachverarbeitung und der Computer Vision und könnte große Auswirkungen auf die Art und Weise haben, in der der Einfluss eines Spielers auf das Spiel gemessen wird.
Connor Heaton ist ein Doktorand am College of IST.
Heaton sagt, dass die bestehende Familie von Methoden auf der Anzahl der Male basiert, die ein Spieler oder ein Team ein diskretes Ereignis erreicht, wie zum Beispiel einen Home Run. Diese Methoden berücksichtigen jedoch nicht den Kontext jeder Aktion.
„Stellen Sie sich ein Szenario vor, in dem ein Spieler in seinem letzten Plate-Appearance einen Single erzielt“, sagte Heaton. „Er könnte einen Dribbler auf die dritte Base-Linie geschlagen haben, einen Läufer von der ersten zur zweiten Base vorgerückt und den Wurf zum ersten Mal geschlagen, oder einen Ball tief ins linke Feld geschlagen und bequem die erste Base erreicht, aber nicht die Geschwindigkeit gehabt, um einen Doppel zu erreichen. Beide Situationen als „ein Single“ zu beschreiben, ist genau, aber erzählt nicht die ganze Geschichte.“
Das neue Modell
Heatons Modell basiert auf dem Lernen der Bedeutung von Ereignissen im Spiel, die auf ihren Auswirkungen auf das Spiel und ihrem Kontext basiert. Das Modell betrachtet das Spiel dann als eine Folge von Ereignissen, um numerische Darstellungen davon zu erstellen, wie Spieler das Spiel beeinflussen.
„Wir sprechen oft über Baseball in Bezug auf ‚diesen Spieler hatte gestern zwei Singles und einen Doppel‘ oder ‚er war eins von vier‘“, sagte Heaton. „Viele der Arten, wie wir über das Spiel sprechen, fassen die Ereignisse mit einer Zusammenfassungsstatistik zusammen. Unsere Arbeit versucht, ein umfassenderes Bild des Spiels zu erstellen und eine nuanciertere, computergestützte Beschreibung davon zu erhalten, wie Spieler das Spiel beeinflussen.“
Die neue Methode nutzt sequenzielle Modellierungstechniken in der NLP, um Computern beizubringen, die Bedeutung verschiedener Wörter zu lernen. Heaton nutzte dies, um seinem Modell die Bedeutung von Ereignissen im Baseballspiel beizubringen, wie zum Beispiel einem Schlagmann, der einen Single schlägt. Das Spiel wurde dann als eine Folge von Ereignissen modelliert.
„Die Auswirkung dieser Arbeit ist das Framework, das für das vorgeschlagene ‚Befragen des Spiels‘ vorgeschlagen wird“, sagte Heaton. „Wir betrachten es als eine Folge in diesem gesamten computergestützten Gerüst, um ein Spiel zu modellieren.“
Das Modell kann die Einflussnahme eines Spielers auf das Spiel über den kurzen Zeitraum hinweg beschreiben und kann, wenn es mit herkömmlichen Methoden kombiniert wird, den Gewinner eines Spiels mit über 59% Genauigkeit vorhersagen.
Trainieren des Modells
Die Forscher trainierten ihr Modell, indem sie Daten verwendeten, die zuvor von Systemen gesammelt wurden, die in den Stadien der Major League Baseball installiert waren. Diese Systeme verfolgen detaillierte Informationen für jeden Pitch, einschließlich Spielerpositionierung, Base-Belegung und Pitch-Geschwindigkeit. Zwei Arten von Daten wurden verwendet. Die erste war Pitch-für-Pitch-Daten, die halfen, Informationen wie Pitch-Typ zu analysieren. Die zweite war Saison-für-Saison-Daten, die verwendet wurden, um positionsspezifische Informationen zu untersuchen.
Jeder Pitch in der gesammelten Datenmenge hatte drei Hauptmerkmale, nämlich das spezifische Spiel, die Anzahl der At-Bats im Spiel und die Anzahl der Pitches im At-Bat. Diese Daten ermöglichten es den Forschern, die Folge von Ereignissen zu rekonstruieren, die ein MLB-Spiel ausmachen.
Um die Ereignisse zu beschreiben, wie sie passierten, und wer an jedem Spiel beteiligt war, identifizierte das Team 325 mögliche Spieländerungen, die auftreten können, wenn ein Pitch geworfen wird. Dies wurde dann mit bestehenden Daten kombiniert und Spielerakten wurden interpoliert.
Prasenjit Mitra ist Professor für Information Sciences and Technology und Co-Autor des Papers.
“Diese Arbeit hat das Potenzial, den aktuellen Stand der Sabermetrik erheblich voranzutreiben”, sagte Prof. Mitra. “Soviel wir wissen, ist unsere Arbeit die erste, die einen nuancierten Zustand des Spiels erfassen und darstellen kann und diese Informationen als Kontext verwenden kann, um die individuellen Ereignisse zu bewerten, die von traditionellen Statistiken gezählt werden – zum Beispiel, indem automatisch ein Modell aufgebaut wird, das wichtige Momente und entscheidende Ereignisse versteht.”










