Vernetzen Sie sich mit uns

KĂŒnstliche Intelligenz

Modell fĂŒr maschinelles Lernen misst die Leistungen von MLB-Spielern

mm

Ein Forscherteam am Penn State College of Information Sciences and Technology hat ein Modell fĂŒr maschinelles Lernen entwickelt, mit dem sich die kurz- und langfristige Leistung von Baseballspielern und -teams besser messen lĂ€sst. Die neue Methode wurde mit bestehenden statistischen Analysemethoden namens Sabermetrics verglichen.

Die Forschung wurde in einem Artikel mit dem Titel „Using Machine Learning to Describe How Players Impact the Game in the MLB“ vorgestellt. 

Aufbauend auf NLP und Computer Vision

Der Ansatz des Teams stĂŒtzte sich auf die jĂŒngsten Fortschritte in der Verarbeitung natĂŒrlicher Sprache und der Computervision und könnte große Auswirkungen auf die Art und Weise haben, wie der Einfluss des Spielers auf das Spiel gemessen wird. 

Connor Heaton ist Doktorand am College of IST. 

Heaton sagt, dass die bestehende Methodenfamilie darauf basiert, wie oft ein Spieler oder eine Mannschaft ein bestimmtes Ereignis erreicht, beispielsweise einen Homerun. Diese Methoden berĂŒcksichtigen nicht den Kontext jeder Aktion. 

„Stellen Sie sich ein Szenario vor, in dem ein Spieler bei seinem letzten Plattenauftritt eine Single aufgenommen hat“, sagte Heaton. „Er hĂ€tte ein Dribbling an der dritten Baselinie ausfĂŒhren können, einen LĂ€ufer von der ersten zur zweiten Base vorrĂŒcken lassen und den Wurf zur ersten Base schlagen können, oder er hĂ€tte einen Ball tief ins linke Feld schlagen und bequem die erste Base erreichen können, aber er hatte nicht die Geschwindigkeit, um darauf zu drĂ€ngen ein DoppelgĂ€nger. Die Beschreibung beider Situationen als „eine einzige“ ist zutreffend, erzĂ€hlt aber nicht die ganze Geschichte.“

Das neue Modell

Heatons Modell basiert auf dem Erlernen der Bedeutung von Ereignissen im Spiel, die auf der Auswirkung, die sie auf das Spiel und ihren Kontext haben, basiert. Das Modell betrachtet das Spiel dann als eine Abfolge von Ereignissen, um numerische Darstellungen darĂŒber auszugeben, wie Spieler das Spiel beeinflussen.

„Wir reden oft ĂŒber Baseball im Sinne von ‚Dieser Spieler hatte gestern zwei Einzel und ein Doppel‘.“ oder „Er ging eins zu vier“, sagte Heaton. „Viele der Arten, wie wir ĂŒber das Spiel sprechen, fassen die Ereignisse lediglich in einer zusammenfassenden Statistik zusammen. „Unsere Arbeit versucht, ein ganzheitlicheres Bild des Spiels zu zeichnen und eine differenziertere, rechnerische Beschreibung darĂŒber zu erhalten, wie Spieler das Spiel beeinflussen.“ 

Die neue Methode nutzt sequentielle Modellierungstechniken im NLP, um Computern das Erlernen der Bedeutung verschiedener Wörter zu ermöglichen. Heaton nutzte dies, um seinem Modell die Bedeutung von Ereignissen im Baseballspiel beizubringen, beispielsweise wenn ein Schlagmann einen Single schlĂ€gt. Das Spiel wurde dann als Abfolge von Ereignissen modelliert. 

„Die Wirkung dieser Arbeit ist der Rahmen, der fĂŒr das vorgeschlagen wird, was ich gerne als ‚Befragung des Spiels‘ bezeichne“, sagte Heaton. „Wir betrachten es als eine Sequenz in diesem gesamten RechengerĂŒst zur Modellierung eines Spiels.“ 

Das Modell ist in der Lage, den Einfluss eines Spielers auf das Spiel kurzfristig zu beschreiben und in Kombination mit herkömmlichen Methoden den Gewinner eines Spiels mit einer Genauigkeit von ĂŒber 59 % vorherzusagen. 

Das Modell trainieren 

Die Forscher trainierten ihr Modell anhand von Daten, die zuvor von Systemen gesammelt wurden, die in Baseballstadien der Major League installiert waren. Diese Systeme verfolgen detaillierte Informationen zu jedem Spielfeld, einschließlich Spielerpositionierung, Belegung des Spielfelds und Spielfeldgeschwindigkeit. Es wurden zwei Arten von Daten verwendet. Das erste waren Tonhöhendaten, die dabei halfen, Informationen wie den Tonhöhentyp zu analysieren. Bei der zweiten handelte es sich um Saison-fĂŒr-Saison-Daten, die zur Untersuchung positionsspezifischer Informationen verwendet wurden. 

Jeder Pitch innerhalb des gesammelten Datensatzes wies drei Hauptmerkmale auf: das spezifische Spiel, die At-Bat-Nummer innerhalb des Spiels und die Pitch-Nummer innerhalb des At-Bat. Mithilfe dieser Daten konnten die Forscher die Abfolge der Ereignisse rekonstruieren, die ein MLB-Spiel ausmachen. 

Um die Ereignisse zu beschreiben, wie sie passierten und wer an jedem Spielzug beteiligt war, identifizierte das Team 325 mögliche SpielÀnderungen, die auftreten können, wenn ein Wurf geworfen wird. Diese wurden dann mit vorhandenen Daten kombiniert und Spielerrekorde wurden unterstellt.

Prasenjit Mitra ist Professor fĂŒr Informationswissenschaften und Technologie sowie Mitautor des Artikels. 

„Diese Arbeit hat das Potenzial, den Stand der Technik in der Sabermetrik erheblich voranzutreiben“, sagte Prof. Mitrae. „Nach unserem besten Wissen sind wir die ersten, die einen differenzierten Zustand des Spiels erfassen und darstellen und diese Informationen als Kontext nutzen, um die einzelnen Ereignisse zu bewerten, die von traditionellen Statistiken gezĂ€hlt werden – zum Beispiel durch die automatische Erstellung eines Modells, das.“ versteht SchlĂŒsselmomente und entscheidende Ereignisse.“

Alex McFarland ist ein KI-Journalist und Autor, der sich mit den neuesten Entwicklungen in der kĂŒnstlichen Intelligenz beschĂ€ftigt. Er hat mit zahlreichen KI-Startups und Publikationen weltweit zusammengearbeitet.