Connect with us

L’ascesa dei modelli di base per serie temporali per l’analisi e la previsione dei dati

Strumenti di IA 101

L’ascesa dei modelli di base per serie temporali per l’analisi e la previsione dei dati

mm

Time series forecasting svolge un ruolo vitale nei processi decisionali cruciali in vari settori, come retail, finanza, produzione e sanità. Tuttavia, rispetto a domini come natural language processing e image recognition, l’integrazione di tecniche di intelligenza artificiale (AI) avanzate nella previsione di serie temporali è stata relativamente lenta. Sebbene foundational AI abbia fatto significativi progressi in aree come l’elaborazione del linguaggio naturale e il riconoscimento delle immagini, il suo impatto sulla previsione di serie temporali è stato limitato fino a poco tempo fa. Tuttavia, c’è ora un crescente slancio nello sviluppo di modelli di base specificamente progettati per la previsione di serie temporali. Questo articolo discuterà l’evoluzione del panorama dell’intelligenza artificiale di base per la previsione di serie temporali, esplorando i recenti progressi in questo dominio.

Previsione di serie temporali e applicazioni

I dati di serie temporali si riferiscono a una sequenza di dati raccolti o registrati a intervalli di tempo regolari. Questo tipo di dati è diffuso in vari domini, come economia, meteorologia, salute e altro. Ogni punto dati in una serie temporale è contrassegnato con un timestamp e la sequenza è spesso utilizzata per analizzare tendenze, modelli e variazioni stagionali nel tempo.

La previsione di serie temporali coinvolge l’utilizzo dei dati storici per prevedere valori futuri nella serie. È un metodo critico nella statistica e nell’apprendimento automatico che aiuta a prendere decisioni informate in base ai modelli passati. La previsione può essere semplice come proiettare lo stesso tasso di crescita nel futuro o complessa come utilizzare modelli di intelligenza artificiale per prevedere tendenze future in base a modelli intricati e fattori esterni.

Alcune applicazioni della previsione di serie temporali sono le seguenti:

  • Mercati finanziari: Nella finanza, la previsione di serie temporali viene utilizzata per prevedere i prezzi delle azioni, i tassi di cambio e le tendenze del mercato. Gli investitori e gli analisti utilizzano i dati storici per prevedere i movimenti futuri e prendere decisioni di trading.
  • Previsione del tempo: I dipartimenti meteorologici utilizzano i dati di serie temporali per prevedere le condizioni meteorologiche. Analizzando i dati meteorologici passati, prevedono i modelli meteorologici futuri, aiutando nella pianificazione e nella decisione per l’agricoltura, i viaggi e la gestione delle calamità.
  • Vendite e marketing: Le aziende utilizzano la previsione di serie temporali per prevedere le vendite future, la domanda e il comportamento dei consumatori. Ciò aiuta nella gestione delle scorte, nella definizione degli obiettivi di vendita e nello sviluppo di strategie di marketing.
  • Settore energetico: Le aziende energetiche prevedono la domanda e l’offerta per ottimizzare la produzione e la distribuzione. La previsione di serie temporali aiuta a prevedere i modelli di consumo di energia, consentendo una gestione e una pianificazione efficienti dell’energia.
  • Sanità: Nel settore sanitario, la previsione di serie temporali viene utilizzata per prevedere le epidemie, le ammissioni dei pazienti e le esigenze di inventario medico. Ciò aiuta nella pianificazione sanitaria, nell’allocazione delle risorse e nella definizione delle politiche.

Modelli di base per serie temporali

I modelli di intelligenza artificiale di base sono modelli estensivi e pre-addestrati che costituiscono la base per varie applicazioni di intelligenza artificiale. Sono addestrati su grandi e diversi set di dati, consentendo loro di discernere modelli, connessioni e strutture all’interno dei dati. Il termine “di base” si riferisce alla loro capacità di essere adattati o modificati per compiti o domini con un addestramento aggiuntivo minimo. Nel contesto della previsione di serie temporali, questi modelli sono costruiti in modo simile ai large language models (LLM), utilizzando architetture transformer. Come LLM, sono addestrati a prevedere l’elemento successivo o mancante in una sequenza di dati. Tuttavia, a differenza di LLM, che elaborano il testo come subword attraverso layer transformer, i modelli di base per serie temporali trattano le sequenze di punti temporali continui come token, consentendo loro di elaborare sequenzialmente i dati di serie temporali.

Recentemente, sono stati sviluppati vari modelli di base per i dati di serie temporali. Con una migliore comprensione e la scelta del modello di base appropriato, possiamo sfruttare più efficacemente e efficientemente le loro capacità. Nelle sezioni successive, esploreremo i diversi modelli di base disponibili per l’analisi dei dati di serie temporali.

  • TimesFM: Sviluppato da Google Research, TimesFM è un modello di base decoder-only con 200 milioni di parametri. Il modello è addestrato su un set di dati di 100 miliardi di punti temporali reali, che comprende sia dati sintetici che reali da varie fonti come Google Trends e Wikipedia Pageviews. TimesFM è in grado di previsione zero-shot in più settori, tra cui retail, finanza, produzione, sanità e scienze naturali, su diverse granularità temporali. Google intende rilasciare TimesFM sulla sua piattaforma Google Cloud Vertex AI, fornendo le sue funzionalità di previsione avanzate ai clienti esterni.
  • Lag-Llama: Creata da ricercatori dell’Université de Montréal, Mila-Québec AI Institute e McGill University, Lag-Llama è un modello di base progettato per la previsione univariata probabilistica di serie temporali. Costruito sul fondamento di Llama, il modello utilizza un’architettura transformer decoder-only che utilizza ritardi temporali e risoluzioni temporali variabili per la previsione. Il modello è addestrato su set di dati di serie temporali diversi da varie fonti in sei gruppi diversi, tra cui energia, trasporto, economia, natura, qualità dell’aria e operazioni cloud. Il modello è convenientemente accessibile tramite la libreria Huggingface.
  • Moirai: Sviluppato da Salesforce AI Research, Moirai è un modello di base per serie temporali progettato per la previsione universale. Moirai è addestrato sul set di dati Large-scale Open Time Series Archive (LOTSA), che contiene 27 miliardi di osservazioni da nove domini distinti, rendendolo la più grande raccolta di set di dati di serie temporali aperti. Questo set di dati diverso consente a Moirai di apprendere da una vasta gamma di dati di serie temporali, consentendogli di gestire diversi compiti di previsione. Moirai utilizza più strati di proiezione di patch di dimensioni per catturare modelli temporali su diverse frequenze. Un aspetto importante di Moirai è l’utilizzo di un meccanismo di attenzione any-variato, che consente previsioni su qualsiasi numero di variabili. Il codice, i pesi del modello e i dati associati a Moirai sono disponibili nel repository GitHub chiamato “uni2ts
  • Chronos: Sviluppato da Amazon, Chronos è una raccolta di modelli probabilistici pre-addestrati per la previsione di serie temporali. Costruito sull’architettura transformer T5, i modelli utilizzano un vocabolario di 4096 token e hanno parametri variabili, che vanno da 8 milioni a 710 milioni. Chronos è pre-addestrato su una vasta gamma di dati pubblici e sintetici generati da processi gaussiani. Chronos differisce da TimesFM in quanto è un modello encoder-decoder, che consente l’estrazione di embedding dell’encoder dai dati di serie temporali. Chronos può essere facilmente integrato in un ambiente Python e accessibile tramite la sua API.
  • Moment: Sviluppato congiuntamente da Carnegie Mellon University e University of Pennsylvania, Moment è una famiglia di modelli di base per serie temporali open-source. Utilizza variazioni di architetture T5, tra cui versioni small, base e large, con il modello base che incorpora circa 125 milioni di parametri. Il modello subisce un pre-addestramento sul vasto “Time-series Pile”, una raccolta diversificata di dati di serie temporali pubblici che coprono vari domini. A differenza di molti altri modelli di base, MOMENT è pre-addestrato su una vasta gamma di compiti, aumentando la sua efficacia in applicazioni come previsione, classificazione, rilevamento di anomalie e imputazione. Il repository Python completo e il codice del notebook Jupyter sono pubblicamente accessibili per l’utilizzo del modello.

Il punto fondamentale

La previsione di serie temporali è uno strumento cruciale in vari domini, dalla finanza alla sanità, che consente di prendere decisioni informate in base ai modelli storici. Modelli di base avanzati come TimesFM, Chronos, Moment, Lag-Llama e Moirai offrono capacità sofisticate, sfruttando architetture transformer e set di dati di addestramento diversi per una previsione e un’analisi accurate. Questi modelli forniscono uno sguardo sul futuro dell’analisi di serie temporali, dotando aziende e ricercatori di strumenti potenti per navigare paesaggi di dati complessi in modo efficace.

Il dottor Tehseen Zia è un professore associato con tenure presso l'Università COMSATS di Islamabad, con un dottorato in Intelligenza Artificiale presso l'Università Tecnica di Vienna, Austria. Specializzato in Intelligenza Artificiale, Apprendimento Automatico, Scienza dei Dati e Visione Artificiale, ha apportato contributi significativi con pubblicazioni su riviste scientifiche reputate. Il dottor Tehseen ha anche guidato vari progetti industriali come principale investigatore e ha lavorato come consulente di Intelligenza Artificiale.