stub The Rise of Time-Series Foundation Modeller for dataanalyse og prognoser - Unite.AI
Kontakt med oss

Kunstig intelligens

The Rise of Time-Series Foundation-modeller for dataanalyse og prognoser

mm
oppdatert on

Tidsserier prognoser spiller en viktig rolle i avgjørende beslutningsprosesser på tvers av ulike bransjer som detaljhandel, finans, produksjon og helsevesen. Men sammenlignet med domener som naturlig språkbehandling og bildegjenkjenning, har integreringen av avansert kunstig intelligens (AI)-teknikker i tidsserieprognoser vært relativt sakte. Selv om grunnleggende AI har gjort betydelige fremskritt på områder som naturlig språkbehandling og bildegjenkjenning, har innvirkningen på tidsserieprognoser vært begrenset inntil nylig. Likevel er det nå et økende momentum i utviklingen av grunnleggende modeller som er spesielt skreddersydd for tidsserieprognoser. Denne artikkelen vil diskutere det utviklende landskapet til grunnleggende AI for tidsserieprognoser, og utforske de siste fremskrittene på dette domenet.

Tidsserieprognoser og applikasjoner

Tidsseriedata refererer til en sekvens av datapunkter som samles inn eller registreres med jevne tidsintervaller. Denne typen data er utbredt på tvers av ulike domener, for eksempel økonomi, vær, helse og mer. Hvert datapunkt i en tidsserie er tidsstemplet, og sekvensen brukes ofte til å analysere trender, mønstre og sesongvariasjoner over tid.

Tidsserieprognoser innebærer å bruke historiske data for å forutsi fremtidige verdier i serien. Det er en kritisk metode innen statistikk og maskinlæring som hjelper til med å ta informerte beslutninger basert på tidligere mønstre. Prognoser kan være så enkelt som å projisere den samme vekstraten inn i fremtiden eller så komplisert som å bruke AI-modeller for å forutsi fremtidige trender basert på intrikate mønstre og eksterne faktorer.

Noen anvendelser av tidsserieprognoser er som følger:

  • Finansmarkedene: I finans brukes tidsserieprognoser til å forutsi aksjekurser, valutakurser og markedstrender. Investorer og analytikere bruker historiske data til å forutsi fremtidige bevegelser og ta handelsbeslutninger.
  • Værmelding: Meteorologiske avdelinger bruker tidsseriedata for å forutsi værforhold. Ved å analysere tidligere værdata forutsier de fremtidige værmønstre, og hjelper til med planlegging og beslutningstaking for landbruk, reiser og katastrofehåndtering.
  • Salg og markedsføring: Bedrifter bruker tidsserieprognoser for å forutsi fremtidig salg, etterspørsel og forbrukeratferd. Dette hjelper med lagerstyring, sette salgsmål og utvikle markedsføringsstrategier.
  • Energisektoren: Energiselskaper forutsier etterspørsel og tilbud for å optimalisere produksjon og distribusjon. Tidsserieprognoser hjelper til med å forutsi energiforbruksmønstre, noe som muliggjør effektiv energistyring og planlegging.
  • Helsevesen: I helsesektoren brukes tidsserieprognoser for å forutsi sykdomsutbrudd, pasientinnleggelser og krav til medisinsk inventar. Dette hjelper til med planlegging av helsetjenester, ressursallokering og politikkutforming.

Foundation Time Series-modeller

Grunnleggende AI-modeller er omfattende, forhåndstrente modeller som danner grunnlaget for ulike kunstig intelligens-applikasjoner. De er trent på store og mangfoldige datasett, noe som gjør dem i stand til å skjelne mønstre, sammenhenger og strukturer i dataene. Begrepet "grunnleggende" refererer til deres evne til å bli finjustert eller modifisert for oppgaver eller domener med minimal tilleggsopplæring. I sammenheng med tidsserieprognoser er disse modellene konstruert på samme måte som store språkmodeller (LLMs), ved hjelp av transformatorarkitekturer. I likhet med LLM-er er de opplært til å forutsi det påfølgende eller manglende elementet i en datasekvens. I motsetning til LLM-er, som behandler tekst som underord gjennom transformatorlag, behandler grunnleggende tidsseriemodeller sekvenser av kontinuerlige tidspunkter som tokens, slik at de kan sekvensielt behandle tidsseriedata.

Nylig er det utviklet ulike grunnleggende modeller for tidsseriedata. Med bedre forståelse og valg av riktig grunnmodell kan vi utnytte deres evner mer effektivt og effektivt. I de påfølgende avsnittene vil vi utforske de forskjellige grunnleggende modellene som er tilgjengelige for analyse av tidsseriedata.

  • TimesFM: TimesFM er utviklet av Google Research, og er en grunnleggende modell med 200 millioner parametere som kun er dekoder. Modellen er trent på et datasett med 100 milliarder virkelige tidspunkter, som omfatter både syntetiske og faktiske data fra forskjellige kilder som Google Trends og Wikipedia Sidevisninger. TimesFM er i stand til nullskuddsprognoser i flere sektorer, inkludert detaljhandel, finans, produksjon, helsevesen og naturvitenskap, på tvers av forskjellige tidsgranulariteter. Google har til hensikt å gi ut TimesFM på sin Google Cloud Vertex AI-plattform, og tilby sine sofistikerte prognosefunksjoner til eksterne kunder.
  • Lag-lama: Lag-Llama er laget av forskere fra Université de Montréal, Mila-Québec AI Institute og McGill University, og er en grunnleggende modell designet for univariat probabilistisk tidsserieprognose. Bygget på grunnlaget for Llama, benytter modellen en transformatorarkitektur som kun er dekoder som bruker tidsforsinkelser og tidsoppløsninger med variabel størrelse for prognoser. Modellen er trent på forskjellige tidsseriedatasett fra flere kilder på tvers av seks forskjellige grupper, inkludert energi, transport, økonomi, natur, luftkvalitet og skyoperasjoner. Modellen er lett tilgjengelig gjennom Huggingface bibliotek.
  • Moirai: Moirai er utviklet av Salesforce AI Research, og er en grunnleggende tidsseriemodell designet for universell prognose. Moirai er trent på datasettet Large-scale Open Time Series Archive (LOTSA), som inneholder 27 milliarder observasjoner fra ni distinkte domener, noe som gjør det til den største samlingen av datasett for åpne tidsserier. Dette mangfoldige datasettet lar Moirai lære av et bredt spekter av tidsseriedata, slik at det kan håndtere forskjellige prognoseoppgaver. Moirai bruker flere projeksjonslag i patchstørrelse for å fange opp tidsmønstre på tvers av forskjellige frekvenser. Et viktig aspekt ved Moirai er å bruke en hvilken som helst variert oppmerksomhetsmekanisme, som tillater prognoser på tvers av et hvilket som helst antall variabler. Koden, modellvektene og dataene knyttet til Moirai er tilgjengelige i GitHub-depotet kalt "uni2ts"
  • Chronos: Chronos er utviklet av Amazon, og er en samling ferdigtrente sannsynlighetsmodeller for tidsserieprognoser. Bygget på T5-transformatorarkitekturen, bruker modellene et vokabular på 4096 tokens og har varierende parametere, fra 8 millioner til 710 millioner. Chronos er fortrent på et stort utvalg offentlige og syntetiske data generert fra Gaussiske prosesser. Chronos skiller seg fra TimesFM ved at det er en koder-dekoder-modell, som muliggjør utvinning av koder-innbygginger fra tidsseriedata. Chronos kan enkelt integreres i et Python-miljø og få tilgang til det API.
  • Moment: Moment er utviklet i samarbeid av Carnegie Mellon University og University of Pennsylvania, og er en familie med åpen kildekode grunnleggende tidsseriemodeller. Den bruker variasjoner av T5-arkitekturer, inkludert små, basis- og store versjoner, med basismodellen som inneholder omtrent 125 millioner parametere. Modellen gjennomgår foropplæring på den omfattende "Time-series Pile", en mangfoldig samling av offentlige tidsseriedata som spenner over forskjellige domener. I motsetning til mange andre grunnleggende modeller, er MOMENT forhåndsopplært på et bredt spekter av oppgaver, noe som øker effektiviteten i applikasjoner som prognoser, klassifisering, avviksdeteksjon og imputering. Det komplette Python-depotet og Jupyter-notisboken kode er offentlig tilgjengelig for bruk av modellen.

Bunnlinjen

Tidsserieprognoser er et avgjørende verktøy på tvers av ulike domener, fra finans til helsetjenester, som muliggjør informert beslutningstaking basert på historiske mønstre. Avanserte grunnleggende modeller som TimesFM, Chronos, Moment, Lag-Llama og Moirai tilbyr sofistikerte funksjoner, utnytter transformatorarkitekturer og ulike opplæringsdatasett for nøyaktig prognose og analyse. Disse modellene gir et glimt inn i fremtiden for tidsserieanalyse, og gir bedrifter og forskere kraftfulle verktøy for å navigere i komplekse datalandskap effektivt.

Dr. Tehseen Zia er en fast førsteamanuensis ved COMSATS University Islamabad, med en doktorgrad i AI fra Wiens teknologiske universitet, Østerrike. Med spesialisering i kunstig intelligens, maskinlæring, datavitenskap og datasyn, har han gitt betydelige bidrag med publikasjoner i anerkjente vitenskapelige tidsskrifter. Dr. Tehseen har også ledet ulike industrielle prosjekter som hovedetterforsker og fungert som AI-konsulent.