AI-verktøy 101
Oppsvinget av tidsseriefondmodeller for dataanalyse og prognose
Tidsserier prognose spiller en vital rolle i avgjørende beslutningsprosesser over flere bransjer, som detaljhandel, finans, produksjon og helsevesen. Imidlertid, sammenlignet med domener som naturlig språkbehandling og bildeforskjelling, har integreringen av avanserte kunstig intelligens (AI) tekniker i tidsserierprognose vært relativt langsom. Selv om grunnleggende AI har gjort betydelig fremgang i områder som naturlig språkbehandling og bildeforskjelling, har dens innvirkning på tidsserierprognose vært begrenset til nylig. Likevel, er det nå en økende momentum i utviklingen av grunnleggende modeller som er spesifikt tilpasset for tidsserierprognose. Denne artikkelen vil diskutere den utviklende landskapet av grunnleggende AI for tidsserierprognose, og utforske de nyeste fremgangene i dette domenet.
Tidsserierprognose og anvendelser
Tidsseriedata refererer til en sekvens av datapunkter samlet eller registrert i regelmessige tidsintervaller. Denne type data er vanlig over flere domener, som økonomi, vær, helse og mer. Hver datapunkt i en tidsserie er tidsstemplet, og sekvensen brukes ofte til å analysere trender, mønster og sesongvariasjoner over tid.
Tidsserierprognose innebærer å bruke historiske data til å forutsi fremtidige verdier i serien. Det er en kritisk metode i statistikk og maskinlæring som hjelper i å ta informerte beslutninger basert på tidligere mønster. Prognose kan være så enkelt som å projisere samme vekstrate inn i fremtiden eller så kompleks som å bruke AI-modeller til å forutsi fremtidige trender basert på intrikate mønster og eksterne faktorer.
Noen anvendelser av tidsserierprognose er som følger:
- Finansmarkeder: I finans, brukes tidsserierprognose til å forutsi aksjepriser, valutakurser og markedstrender. Investorer og analytikere bruker historiske data til å forutsi fremtidige bevegelser og ta handelsbeslutninger.
- Værprognose: Meteorologiske avdelinger bruker tidsseriedata til å forutsi værforhold. Ved å analysere tidligere værdata, forutsier de fremtidige værmønster, hvilket hjelper i planlegging og beslutningstaking for landbruk, reise og katastrofehåndtering.
- Salg og markedsføring: Bedrifter bruker tidsserierprognose til å forutsi fremtidige salg, etterspørsel og forbrukeratferd. Dette hjelper i lagerstyring, å sette salgs mål og utvikle markedsføringsstrategier.
- Energisektoren: Energiselskaper forutsier etterspørsel og tilbud for å optimalisere produksjon og distribusjon. Tidsserierprognose hjelper i å forutsi energiforbruksmønster, hvilket muliggjør effektiv energistyring og planlegging.
- Helsevesen: I helsevesenet, brukes tidsserierprognose til å forutsi sykdomsutbrudd, pasientinnleggelser og medisinsk lagerbehov. Dette hjelper i helseplanlegging, ressursallokering og politikkutforming.
Grunnleggende tidsseriemodeller
Grunnleggende AI-modeller er omfattende, forhåndstrente modeller som danner grunnlaget for ulike kunstig intelligens-applikasjoner. De er trent på store og diverse datasett, hvilket gjør dem i stand til å gjenkjenne mønster, sammenhenger og strukturer innen data. Begrepet “grunnleggende” refererer til deres evne til å bli finjustert eller modifisert for oppgaver eller domener med minimal ekstra trening. I sammenheng med tidsserierprognose, konstrueres disse modellene på samme måte som store språkmodeller (LLM), ved å bruke transformer-arkitekturer. Like LLM, er de trent til å forutsi det påfølgende eller manglende element i en datasekvens. Imidlertid, i motsetning til LLM, som behandler tekst som subord som transformerlag, behandler grunnleggende tidsseriemodeller sekvenser av kontinuerlige tidspunkter som token, hvilket gjør dem i stand til å sekvensielt prosessere tidsseriedata.
Nylig er det utviklet flere grunnleggende modeller for tidsseriedata. Med bedre forståelse og valg av den riktige grunnleggende modellen, kan vi mer effektivt og effisient utnytte deres evner. I de påfølgende seksjonene, vil vi utforske de ulike grunnleggende modellene som er tilgjengelige for tidsseriedataanalyse.
- TimesFM: Utviklet av Google Research, er TimesFM en decoder-bare grunnleggende modell med 200 millioner parametre. Modellen er trent på et datasett på 100 milliarder virkelige tidspunkter, som omfatter både syntetiske og faktiske data fra ulike kilder som Google Trends og Wikipedia Pageviews. TimesFM er i stand til å utføre nullskuddsprognose i flere sektorer, inkludert detaljhandel, finans, produksjon, helsevesen og naturvitenskap, over ulike tidsgrenser. Google har til hensikt å utgi TimesFM på sin Google Cloud Vertex AI-plattform, og tilby sine avanserte prognosefunksjoner til eksterne kunder.
- Lag-Llama: Skapt av forskere fra Université de Montréal, Mila-Québec AI Institute og McGill University, er Lag-Llama en grunnleggende modell designet for univariat probabilistisk tidsserierprognose. Bygget på grunnlag av Llama, bruker modellen en decoder-bare transformer-arkitektur som bruker variabel størrelse tidslag og tidsløsninger for prognose. Modellen er trent på diverse tidsseriedatasett fra flere kilder over seks ulike grupper, inkludert energi, transport, økonomi, natur, luftkvalitet og skytjenester. Modellen er lett tilgjengelig gjennom Huggingface-biblioteket.
- Moirai: Utviklet av Salesforce AI Research, er Moirai en grunnleggende tidsseriemodell designet for universell prognose. Moirai er trent på Large-scale Open Time Series Archive (LOTSA)-datasettet, som inneholder 27 milliarder observasjoner fra ni ulike domener, og er dermed det største samlingen av åpne tidsseriedatasett. Dette diverse datasettet gjør det mulig for Moirai å lære fra en bred rekke tidsseriedata, og å håndtere ulike prognoseoppgaver. Moirai bruker flere patch-størrelse-projeksjonslag for å fange temporale mønster over ulike frekvenser. En viktig aspekt ved Moirai er å bruke en hvilken-som-helst-variabel oppmerksomhetsmekanisme, som gjør det mulig å foreta prognoser over hvilket som helst antall variabler. Koden, modellvektene og dataene tilknyttet Moirai er tilgjengelige i GitHub-repositoriet kalt “uni2ts“
- Chronos: Utviklet av Amazon, er Chronos en samling av forhåndstrente probabilistiske modeller for tidsserierprognose. Bygget på T5-transformer-arkitekturen, bruker modellene et vokabular på 4096 token og har variabel størrelse, fra 8 millioner til 710 millioner parametre. Chronos er forhåndstrent på et stort utvalg offentlige og syntetiske data generert fra Gaussiske prosesser. Chronos skiller seg fra TimesFM ved at det er en encoder-decoder-modell, som muliggjør uttrekk av encoder-embeddings fra tidsseriedata. Chronos kan lett integreres i en Python-miljø og tilgjengelig via sin API.
- Moment: Utviklet i samarbeid mellom Carnegie Mellon University og University of Pennsylvania, er Moment en familie av åpne grunnleggende tidsseriemodeller. Den bruker variasjoner av T5-arkitekturer, inkludert små, base og store versjoner, med base-modellen som inkorporerer omtrent 125 millioner parametre. Modellen gjennomgår forhåndstrening på det omfattende “Time-series Pile”, en divers samling av offentlige tidsseriedata som spenner over ulike domener. I motsetning til mange andre grunnleggende modeller, er Moment forhåndstrent på et bredt spekter av oppgaver, hvilket øker dens effektivitet i applikasjoner som prognose, klassifisering, anomali-dettektning og imputasjon. Den fullstendige Python-repositoriet og Jupyter-notebook-koden er offentlig tilgjengelige for å bruke modellen.
Bunnlinjen
Tidsserierprognose er et kritisk verktøy over ulike domener, fra finans til helsevesen, og muliggjør informerte beslutninger basert på historiske mønster. Avanserte grunnleggende modeller som TimesFM, Chronos, Moment, Lag-Llama og Moirai tilbyr sofistikerte evner, og utnytter transformer-arkitekturer og diverse treningdatasett for nøyaktig prognose og analyse. Disse modellene gir et glimt inn i fremtiden for tidsserieanalyse, og gir bedrifter og forskere kraftfulle verktøy for å navigere komplekse datalandskaper effektivt.


