Künstliche Intelligenz

Modell für maschinelles Lernen misst die Leistungen von MLB-Spielern

Veröffentlicht 8. April 2022

Aktualisiert December 9, 2022

Alex McFarland

Ein Forscherteam am Penn State College of Information Sciences and Technology hat ein Modell für maschinelles Lernen entwickelt, mit dem sich die kurz- und langfristige Leistung von Baseballspielern und -teams besser messen lässt. Die neue Methode wurde mit bestehenden statistischen Analysemethoden namens Sabermetrics verglichen.

Die Forschung wurde in einem Artikel mit dem Titel „Using Machine Learning to Describe How Players Impact the Game in the MLB“ vorgestellt.

Aufbauend auf NLP und Computer Vision

Der Ansatz des Teams stützte sich auf die jüngsten Fortschritte in der Verarbeitung natürlicher Sprache und der Computervision und könnte große Auswirkungen auf die Art und Weise haben, wie der Einfluss des Spielers auf das Spiel gemessen wird.

Connor Heaton ist Doktorand am College of IST.

Heaton sagt, dass die bestehende Methodenfamilie darauf basiert, wie oft ein Spieler oder eine Mannschaft ein bestimmtes Ereignis erreicht, beispielsweise einen Homerun. Diese Methoden berücksichtigen nicht den Kontext jeder Aktion.

„Stellen Sie sich ein Szenario vor, in dem ein Spieler bei seinem letzten Plattenauftritt eine Single aufgenommen hat“, sagte Heaton. „Er hätte ein Dribbling an der dritten Baselinie ausführen können, einen Läufer von der ersten zur zweiten Base vorrücken lassen und den Wurf zur ersten Base schlagen können, oder er hätte einen Ball tief ins linke Feld schlagen und bequem die erste Base erreichen können, aber er hatte nicht die Geschwindigkeit, um darauf zu drängen ein Doppelgänger. Die Beschreibung beider Situationen als „eine einzige“ ist zutreffend, erzählt aber nicht die ganze Geschichte.“

Das neue Modell

Heatons Modell basiert auf dem Erlernen der Bedeutung von Ereignissen im Spiel, die auf der Auswirkung, die sie auf das Spiel und ihren Kontext haben, basiert. Das Modell betrachtet das Spiel dann als eine Abfolge von Ereignissen, um numerische Darstellungen darüber auszugeben, wie Spieler das Spiel beeinflussen.

„Wir reden oft über Baseball im Sinne von ‚Dieser Spieler hatte gestern zwei Einzel und ein Doppel‘.“ oder „Er ging eins zu vier“, sagte Heaton. „Viele der Arten, wie wir über das Spiel sprechen, fassen die Ereignisse lediglich in einer zusammenfassenden Statistik zusammen. „Unsere Arbeit versucht, ein ganzheitlicheres Bild des Spiels zu zeichnen und eine differenziertere, rechnerische Beschreibung darüber zu erhalten, wie Spieler das Spiel beeinflussen.“

Die neue Methode nutzt sequentielle Modellierungstechniken im NLP, um Computern das Erlernen der Bedeutung verschiedener Wörter zu ermöglichen. Heaton nutzte dies, um seinem Modell die Bedeutung von Ereignissen im Baseballspiel beizubringen, beispielsweise wenn ein Schlagmann einen Single schlägt. Das Spiel wurde dann als Abfolge von Ereignissen modelliert.

„Die Wirkung dieser Arbeit ist der Rahmen, der für das vorgeschlagen wird, was ich gerne als ‚Befragung des Spiels‘ bezeichne“, sagte Heaton. „Wir betrachten es als eine Sequenz in diesem gesamten Rechengerüst zur Modellierung eines Spiels.“

Das Modell ist in der Lage, den Einfluss eines Spielers auf das Spiel kurzfristig zu beschreiben und in Kombination mit herkömmlichen Methoden den Gewinner eines Spiels mit einer Genauigkeit von über 59 % vorherzusagen.

Das Modell trainieren

Die Forscher trainierten ihr Modell anhand von Daten, die zuvor von Systemen gesammelt wurden, die in Baseballstadien der Major League installiert waren. Diese Systeme verfolgen detaillierte Informationen zu jedem Spielfeld, einschließlich Spielerpositionierung, Belegung des Spielfelds und Spielfeldgeschwindigkeit. Es wurden zwei Arten von Daten verwendet. Das erste waren Tonhöhendaten, die dabei halfen, Informationen wie den Tonhöhentyp zu analysieren. Bei der zweiten handelte es sich um Saison-für-Saison-Daten, die zur Untersuchung positionsspezifischer Informationen verwendet wurden.

Jeder Pitch innerhalb des gesammelten Datensatzes wies drei Hauptmerkmale auf: das spezifische Spiel, die At-Bat-Nummer innerhalb des Spiels und die Pitch-Nummer innerhalb des At-Bat. Mithilfe dieser Daten konnten die Forscher die Abfolge der Ereignisse rekonstruieren, die ein MLB-Spiel ausmachen.

Um die Ereignisse zu beschreiben, wie sie passierten und wer an jedem Spielzug beteiligt war, identifizierte das Team 325 mögliche Spieländerungen, die auftreten können, wenn ein Wurf geworfen wird. Diese wurden dann mit vorhandenen Daten kombiniert und Spielerrekorde wurden unterstellt.

Prasenjit Mitra ist Professor für Informationswissenschaften und Technologie sowie Mitautor des Artikels.

„Diese Arbeit hat das Potenzial, den Stand der Technik in der Sabermetrik erheblich voranzutreiben“, sagte Prof. Mitrae. „Nach unserem besten Wissen sind wir die ersten, die einen differenzierten Zustand des Spiels erfassen und darstellen und diese Informationen als Kontext nutzen, um die einzelnen Ereignisse zu bewerten, die von traditionellen Statistiken gezählt werden – zum Beispiel durch die automatische Erstellung eines Modells, das.“ versteht Schlüsselmomente und entscheidende Ereignisse.“

Verwandte Themen:AI künstliche Intelligenz Sport

Alex McFarland

Alex McFarland ist ein KI-Journalist und Autor, der sich mit den neuesten Entwicklungen in der künstlichen Intelligenz beschäftigt. Er hat mit zahlreichen KI-Startups und Publikationen weltweit zusammengearbeitet.

Unite.AI

Modell für maschinelles Lernen misst die Leistungen von MLB-Spielern

Aufbauend auf NLP und Computer Vision

Das neue Modell

Das Modell trainieren

Vielleicht gefällt dir