Seguici sui social

Il modello di machine learning misura le prestazioni dei giocatori di MLB

Intelligenza Artificiale

Il modello di machine learning misura le prestazioni dei giocatori di MLB

mm

Un team di ricercatori del Penn State College of Information Sciences and Technology ha sviluppato un modello di apprendimento automatico in grado di misurare meglio le prestazioni a breve e lungo termine dei giocatori e delle squadre di baseball. Il nuovo metodo è stato misurato rispetto ai metodi di analisi statistica esistenti chiamati sabermetrics.

La ricerca è stata presentata in un documento intitolato "Using Machine Learning to Describe How Players Impact the Game in the MLB". 

Basandosi sulla PNL e sulla visione artificiale

L'approccio del team si è basato sui recenti progressi nell'elaborazione del linguaggio naturale e nella visione artificiale e potrebbe avere grandi implicazioni sul modo in cui viene misurato l'impatto del giocatore sul gioco. 

Connor Heaton è un dottorando al College of IST. 

Heaton afferma che la famiglia di metodi esistente si basa sul numero di volte in cui un giocatore o una squadra raggiunge un evento discreto, come colpire un fuoricampo. Questi metodi non prendono in considerazione il contesto di ogni azione. 

"Pensa a uno scenario in cui un giocatore ha registrato un singolo nella sua ultima apparizione al piatto", ha detto Heaton. “Avrebbe potuto dribblare lungo la linea della terza base, far avanzare un corridore dalla prima alla seconda e battere il tiro in prima, o colpire una palla in profondità sul campo sinistro e raggiungere comodamente la prima base ma non aveva la velocità per spingere per un doppio. Descrivere entrambe le situazioni come risultanti in "un singolo" è accurato ma non racconta l'intera storia.

Il nuovo modello

Il modello di Heaton si basa sull'apprendimento del significato degli eventi in-game, che si basa sull'impatto che hanno sul gioco e sul loro contesto. Il modello quindi vede il gioco come una sequenza di eventi per produrre rappresentazioni numeriche di come i giocatori influenzano il gioco.

“Parliamo spesso di baseball in termini di 'questo giocatore ha avuto due singoli e un doppio ieri.' o 'è andato uno per quattro', ha detto Heaton. “Molti dei modi in cui parliamo del gioco si limitano a riassumere gli eventi con una statistica riassuntiva. "Il nostro lavoro sta cercando di ottenere un'immagine più olistica del gioco e di ottenere una descrizione computazionale più sfumata di come i giocatori influenzano il gioco". 

Il nuovo metodo sfrutta le tecniche di modellazione sequenziale in PNL per consentire ai computer di apprendere il significato di parole diverse. Heaton ha usato questo per insegnare al suo modello il significato degli eventi nella partita di baseball, come un battitore che colpisce un singolo. Il gioco è stato quindi modellato come una sequenza di eventi. 

"L'impatto di questo lavoro è il quadro che viene proposto per quello che mi piace chiamare 'interrogare il gioco'", ha detto Heaton. "Lo stiamo vedendo come una sequenza in tutta questa impalcatura computazionale per modellare un gioco." 

Il modello è in grado di descrivere l'influenza di un giocatore sul gioco a breve termine e, se combinato con i metodi tradizionali, può prevedere il vincitore di una partita con una precisione superiore al 59%. 

Formazione del modello 

I ricercatori hanno addestrato il loro modello utilizzando i dati raccolti in precedenza dai sistemi installati negli stadi di baseball della Major League. Questi sistemi tengono traccia delle informazioni dettagliate per ogni campo, tra cui il posizionamento del giocatore, l'occupazione della base e la velocità del campo. Sono stati utilizzati due tipi di dati. Il primo riguardava i dati passo per passo, che aiutavano ad analizzare informazioni come il tipo di passo. Il secondo riguardava i dati stagione per stagione, utilizzati per indagare su informazioni specifiche sulla posizione. 

Ogni lancio all'interno del set di dati raccolto aveva tre caratteristiche principali, che erano il gioco specifico, il numero di battuta all'interno del gioco e il numero di lancio all'interno della battuta. Questi dati hanno permesso ai ricercatori di ricostruire la sequenza di eventi che compongono un gioco MLB. 

Per descrivere gli eventi accaduti, come sono accaduti e chi è stato coinvolto in ogni gioco, il team ha identificato 325 possibili cambiamenti di gioco che potrebbero verificarsi quando viene lanciato un lancio. Questo è stato quindi combinato con i dati esistenti e sono stati imputati i record dei giocatori.

Prasenjit Mitra è professore di scienze e tecnologia dell'informazione, nonché coautore dell'articolo. 

"Questo lavoro ha il potenziale per far avanzare in modo significativo lo stato dell'arte nella sabermetria", ha affermato il prof. Mitrae. "Per quanto ne sappiamo, il nostro è il primo a catturare e rappresentare uno stato sfumato del gioco e utilizzare queste informazioni come contesto per valutare i singoli eventi che vengono conteggiati dalle statistiche tradizionali, ad esempio costruendo automaticamente un modello che comprende i momenti chiave e gli eventi della frizione.

Alex McFarland è un giornalista e scrittore specializzato in intelligenza artificiale che esplora gli ultimi sviluppi nel campo dell'intelligenza artificiale. Ha collaborato con numerose startup e pubblicazioni di intelligenza artificiale in tutto il mondo.