AI-verktyg 101
Uppgången av tids-serie grundmodeller för dataanalys och prognostisering
Tids-serie prognostisering spelar en avgörande roll i viktiga beslutsprocesser inom olika branscher, såsom detaljhandel, finans, tillverkning och hälsovård. Emellertid har integrationen av avancerade artificiella intelligens (AI) tekniker i tids-serie prognostisering varit relativt långsam jämfört med områden som naturlig språkbehandling och bildigenkänning. Även om grundläggande AI har gjort betydande framsteg inom områden som naturlig språkbehandling och bildigenkänning, har dess påverkan på tids-serie prognostisering varit begränsad tills nyligen. Trots detta finns det nu en ökande momentum i utvecklingen av grundläggande modeller som är specifikt anpassade för tids-serie prognostisering. Den här artikeln kommer att diskutera den utvecklande landskapet av grundläggande AI för tids-serie prognostisering, och utforska de senaste framstegen inom detta område.
Tids-serie prognostisering och tillämpningar
Tids-serie data hänvisar till en sekvens av data punkter som samlas in eller registreras vid regelbundna tidsintervall. Denna typ av data är vanlig inom olika domäner, såsom ekonomi, väder, hälsa och mer. Varje data punkt i en tids-serie är tidsstämplad, och sekvensen används ofta för att analysera trender, mönster och säsongsvariationer över tid.
Tids-serie prognostisering innebär att man använder historiska data för att förutsäga framtida värden i serien. Det är en kritisk metod inom statistik och maskinlärning som hjälper till att fatta informerade beslut baserat på tidigare mönster. Prognostisering kan vara så enkelt som att projicera samma tillväxttakt in i framtiden eller så komplext som att använda AI-modeller för att förutsäga framtida trender baserat på intrikata mönster och yttre faktorer.
Några tillämpningar av tids-serie prognostisering är följande:
- Finansmarknader: Inom finans används tids-serie prognostisering för att förutsäga aktiepriser, valutakurser och marknadstrender. Investorer och analytiker använder historiska data för att förutsäga framtida rörelser och fatta handelsbeslut.
- Väderprognos: Meteorologiska avdelningar använder tids-serie data för att förutsäga väderförhållanden. Genom att analysera tidigare väderdata förutsäger de framtida vädermönster, vilket hjälper till i planering och beslutsfattande för jordbruk, resor och katastrofhantering.
- Försäljning och marknadsföring: Företag använder tids-serie prognostisering för att förutsäga framtida försäljning, efterfrågan och konsumentbeteende. Detta hjälper till i lagerhantering, att sätta försäljningsmål och utveckla marknadsstrategier.
- Energi sektor: Energiföretag förutsäger efterfrågan och utbud för att optimera produktion och distribution. Tids-serie prognostisering hjälper till att förutsäga energiförbrukningsmönster, vilket möjliggör effektiv energihantering och planering.
- Hälsovård: Inom hälsovårdssektorn används tids-serie prognostisering för att förutsäga sjukdomsutbrott, patientinläggningar och medicinska lagerkrav. Detta hjälper till i hälsovårdsplanering, resursfördelning och politiskt beslutsfattande.
Grundläggande tids-serie modeller
Grundläggande AI-modeller är omfattande, förtränade modeller som utgör grunden för olika artificiella intelligensapplikationer. De tränas på stora och varierade dataset, vilket möjliggör att de kan upptäcka mönster, samband och strukturer inom data. Begreppet “grundläggande” hänvisar till deras förmåga att fine-tunas eller modifieras för uppgifter eller domäner med minimal ytterligare utbildning. I sammanhanget med tids-serie prognostisering konstrueras dessa modeller på liknande sätt som stora språkmodeller (LLM), med användning av transformatorarkitektur. Liksom LLM använder de för att förutsäga den efterföljande eller saknade elementet i en data sekvens. Emellertid, till skillnad från LLM, som bearbetar text som subord till genom transformatorlager, behandlar grundläggande tids-serie modeller sekvenser av kontinuerliga tidspunkter som token, vilket möjliggör att de kan bearbeta tids-serie data sekventiellt.
Nyligen har olika grundläggande modeller utvecklats för tids-serie data. Med bättre förståelse och val av lämplig grundläggande modell kan vi mer effektivt och effektivt utnyttja deras förmågor. I de efterföljande avsnitten kommer vi att utforska de olika grundläggande modellerna som finns tillgängliga för tids-serie dataanalys.
- TimesFM: Utvecklad av Google Research, TimesFM är en decoder-endast grundläggande modell med 200 miljoner parametrar. Modellen tränas på en dataset med 100 miljarder realvärlden tidspunkter, som omfattar både syntetiska och faktiska data från varierade källor som Google Trends och Wikipedia Pageviews. TimesFM är kapabel till zero-shot prognostisering i flera sektorer, inklusive detaljhandel, finans, tillverkning, hälsovård och naturvetenskap, över olika tidsgranulariteter. Google avser att släppa TimesFM på sin Google Cloud Vertex AI-plattform, vilket tillhandahåller dess avancerade prognostiseringsegenskaper till externa kunder.
- Lag-Llama: Skapad av forskare från Université de Montréal, Mila-Québec AI Institute och McGill University, Lag-Llama är en grundläggande modell designad för univariat probabilistisk tids-serie prognostisering. Byggd på grunden av Llama, modellen använder en decoder-endast transformatorarkitektur som använder variabla storlekar tidslag och tidsupplösningar för prognostisering. Modellen tränas på diversa tids-serie dataset från flera källor över sex olika grupper, inklusive energi, transport, ekonomi, natur, luftkvalitet och molnoperationer. Modellen är lättillgänglig via Huggingface biblioteket.
- Moirai: Utvecklad av Salesforce AI Research, Moirai är en grundläggande tids-serie modell designad för universell prognostisering. Moirai tränas på Large-scale Open Time Series Archive (LOTSA) dataset, som innehåller 27 miljarder observationer från nio distinkta domäner, vilket gör det till den största samlingen av öppna tids-serie dataset. Denna diversa dataset tillåter Moirai att lära sig från en bred variation av tids-serie data, vilket möjliggör att den kan hantera olika prognostiseringuppgifter. Moirai använder flera patchstorleksprojektionslager för att fånga temporella mönster över olika frekvenser. En viktig aspekt av Moirai är att den använder en varierande uppmärksamhetsmekanism, vilket möjliggör prognostisering över valfritt antal variabler. Koden, modellvikter och data associerade med Moirai är tillgängliga i GitHub-repositoriet som kallas “uni2ts“
- Chronos: Utvecklad av Amazon, Chronos är en samling av förtränade probabilistiska modeller för tids-serie prognostisering. Byggd på T5 transformatorarkitekturen, modellerna använder en vokabulär på 4096 token och har varierande parametrar, från 8 miljoner till 710 miljoner. Chronos är förtränad på en stor mängd offentliga och syntetiska data genererade från Gaussiska processer. Chronos skiljer sig från TimesFM i det att det är en encoder-decoder modell, vilket möjliggör extrahering av encoder-embeddings från tids-serie data. Chronos kan lätt integreras i en Python-miljö och nås via dess API.
- Moment: Utvecklad i samarbete mellan Carnegie Mellon University och University of Pennsylvania, Moment är en familj av öppen-källkodsgrundläggande tids-serie modeller. Den använder variationer av T5-arkitekturer, inklusive små, bas och stora versioner, med basmodellen som omfattar cirka 125 miljoner parametrar. Modellen genomgår förträning på den omfattande “Time-series Pile”, en divers samling av offentliga tids-serie data som spänner över olika domäner. Till skillnad från många andra grundläggande modeller är MOMENT förtränad på en bred variation av uppgifter, vilket förbättrar dess effektivitet i tillämpningar som prognostisering, klassificering, avvikelseupptäckt och imputering. Den fullständiga Python-repositoriet och Jupyter-anteckningskod är offentligt tillgängliga för att utnyttja modellen.
Slutsatsen
Tids-serie prognostisering är ett viktigt verktyg inom olika domäner, från finans till hälsovård, vilket möjliggör informerat beslutsfattande baserat på historiska mönster. Avancerade grundläggande modeller som TimesFM, Chronos, Moment, Lag-Llama och Moirai erbjuder sofistikerade förmågor, som utnyttjar transformatorarkitekturer och diversa träningsdataset för exakt prognostisering och analys. Dessa modeller ger en glimt av framtiden för tids-serie analys, vilket ger företag och forskare kraftfulla verktyg för att navigera komplexa data landskap effektivt.


