Ferramentas de IA 101
O Surgimento de Modelos Fundamentais de Séries Temporais para Análise e Previsão de Dados
Séries temporais previsão desempenha um papel vital nos processos de tomada de decisão cruciais em várias indústrias, como varejo, finanças, manufatura e saúde. No entanto, em comparação com domínios como processamento de linguagem natural e reconhecimento de imagens, a integração de técnicas avançadas de inteligência artificial (IA) na previsão de séries temporais tem sido relativamente lenta. Embora a IA fundamental tenha feito progressos significativos em áreas como processamento de linguagem natural e reconhecimento de imagens, seu impacto na previsão de séries temporais tem sido limitado até recentemente. No entanto, agora há um aumento no desenvolvimento de modelos fundamentais específicamente adaptados para a previsão de séries temporais. Este artigo discutirá a evolução do paisagem da IA fundamental para a previsão de séries temporais, explorando os recentes avanços neste domínio.
Previsão de Séries Temporais e Aplicações
Os dados de séries temporais se referem a uma sequência de pontos de dados coletados ou registrados em intervalos de tempo regulares. Este tipo de dados é prevalente em vários domínios, como economia, clima, saúde e mais. Cada ponto de dados em uma série temporal é marcado com um carimbo de data e hora, e a sequência é frequentemente usada para analisar tendências, padrões e variações sazonais ao longo do tempo.
A previsão de séries temporais envolve o uso de dados históricos para prever valores futuros na série. É um método crítico em estatística e aprendizado de máquina que ajuda na tomada de decisões informadas com base em padrões passados. A previsão pode ser tão simples quanto projetar a mesma taxa de crescimento no futuro ou tão complexa quanto usar modelos de IA para prever tendências futuras com base em padrões intricados e fatores externos.
Algumas aplicações da previsão de séries temporais são as seguintes:
- Mercados Financeiros: No setor financeiro, a previsão de séries temporais é usada para prever preços de ações, taxas de câmbio e tendências do mercado. Investidores e analistas usam dados históricos para prever movimentos futuros e tomar decisões de negociação.
- Previsão do Tempo: Departamentos meteorológicos usam dados de séries temporais para prever condições climáticas. Analisando dados climáticos passados, eles preveem padrões climáticos futuros, ajudando no planejamento e tomada de decisões para agricultura, viagens e gestão de desastres.
- Vendas e Marketing: Empresas utilizam a previsão de séries temporais para prever vendas futuras, demanda e comportamento do consumidor. Isso ajuda no gerenciamento de estoque, definição de metas de vendas e desenvolvimento de estratégias de marketing.
- Setor Energético: Empresas de energia preveem demanda e oferta para otimizar a produção e distribuição. A previsão de séries temporais ajuda a prever padrões de consumo de energia, permitindo um gerenciamento de energia eficiente e planejamento.
- Saúde: No setor de saúde, a previsão de séries temporais é usada para prever surtos de doenças, admissões de pacientes e necessidades de estoque médico. Isso ajuda no planejamento de saúde, alocação de recursos e elaboração de políticas.
Modelos Fundamentais de Séries Temporais
Os modelos de IA fundamentais são modelos extensivos e pré-treinados que formam a base para várias aplicações de inteligência artificial. Eles são treinados em grandes e diversificados conjuntos de dados, permitindo que eles discernam padrões, conexões e estruturas dentro dos dados. O termo “fundamental” se refere à sua capacidade de ser ajustado ou modificado para tarefas ou domínios com treinamento adicional mínimo. No contexto da previsão de séries temporais, esses modelos são construídos de forma semelhante aos grandes modelos de linguagem (LLM), utilizando arquiteturas de transformadores. Como os LLM, eles são treinados para prever o elemento subsequente ou ausente em uma sequência de dados. No entanto, ao contrário dos LLM, que processam texto como subpalavras por meio de camadas de transformadores, os modelos fundamentais de séries temporais tratam sequências de pontos de tempo contínuos como tokens, permitindo que eles processem sequencialmente os dados de séries temporais.
Recentemente, vários modelos fundamentais foram desenvolvidos para dados de séries temporais. Com uma melhor compreensão e escolha do modelo fundamental apropriado, podemos aproveitar mais eficazmente suas capacidades. Nas seções subsequentes, exploraremos os diferentes modelos fundamentais disponíveis para análise de dados de séries temporais.
- TimesFM: Desenvolvido pelo Google Research, o TimesFM é um modelo fundamental decodificador com 200 milhões de parâmetros. O modelo é treinado em um conjunto de dados de 100 bilhões de pontos de tempo reais, abrangendo dados sintéticos e reais de várias fontes, como Google Trends e visualizações de páginas do Wikipedia. O TimesFM é capaz de previsão zero-shot em vários setores, incluindo varejo, finanças, manufatura, saúde e ciências naturais, em diferentes granularidades de tempo. O Google pretende lançar o TimesFM em sua plataforma Google Cloud Vertex AI, fornecendo suas funcionalidades de previsão sofisticadas para clientes externos.
- Lag-Llama: Criado por pesquisadores da Université de Montréal, Mila-Québec AI Institute e McGill University, o Lag-Llama é um modelo fundamental projetado para previsão probabilística univariada de séries temporais. Construído sobre a base do Llama, o modelo emprega uma arquitetura de transformador decodificador que usa tamanhos de atraso e resoluções de tempo variáveis para previsão. O modelo é treinado em conjuntos de dados de séries temporais diversificados de várias fontes, abrangendo seis grupos diferentes, incluindo energia, transporte, economia, natureza, qualidade do ar e operações em nuvem. O modelo está convenientemente acessível por meio da biblioteca Huggingface.
- Moirai: Desenvolvido pela Salesforce AI Research, o Moirai é um modelo de séries temporais fundamental projetado para previsão universal. O Moirai é treinado no conjunto de dados Large-scale Open Time Series Archive (LOTSA), que contém 27 bilhões de observações de nove domínios distintos, tornando-o a maior coleção de conjuntos de dados de séries temporais abertos. Esse conjunto de dados diversificado permite que o Moirai aprenda com uma ampla gama de dados de séries temporais, permitindo que ele lide com diferentes tarefas de previsão. O Moirai usa várias camadas de projeção de tamanho de patch para capturar padrões temporais em várias frequências. Um aspecto importante do Moirai é o uso de um mecanismo de atenção qualquer-variado, permitindo previsões em qualquer número de variáveis. O código, os pesos do modelo e os dados associados ao Moirai estão disponíveis no repositório GitHub chamado “uni2ts“
- Chronos: Desenvolvido pela Amazon, o Chronos é uma coleção de modelos probabilísticos pré-treinados para previsão de séries temporais. Construído sobre a arquitetura de transformador T5, os modelos usam um vocabulário de 4096 tokens e têm parâmetros variados, que vão de 8 milhões a 710 milhões. O Chronos é pré-treinado em uma vasta gama de dados públicos e sintéticos gerados a partir de processos gaussianos. O Chronos difere do TimesFM por ser um modelo codificador-decodificador, o que permite a extração de embeddings do codificador a partir de dados de séries temporais. O Chronos pode ser facilmente integrado a um ambiente Python e acessado por meio de sua API.
- Moment: Desenvolvido colaborativamente pela Carnegie Mellon University e pela University of Pennsylvania, o Moment é uma família de modelos fundamentais de séries temporais de código aberto. Ele utiliza variações de arquiteturas T5, incluindo versões pequena, base e grande, com o modelo base incorporando aproximadamente 125 milhões de parâmetros. O modelo passa por pré-treinamento no extenso “Time-series Pile”, uma coleção diversificada de dados de séries temporais públicos que abrange vários domínios. Ao contrário de muitos outros modelos fundamentais, o MOMENT é pré-treinado em uma ampla gama de tarefas, melhorando sua eficácia em aplicações como previsão, classificação, detecção de anomalias e imputação. O repositório Python completo e o código do notebook Jupyter estão publicamente acessíveis para utilizar o modelo.
A Linha de Fundo
A previsão de séries temporais é uma ferramenta crucial em vários domínios, desde finanças até saúde, permitindo a tomada de decisões informadas com base em padrões históricos. Modelos fundamentais avançados, como TimesFM, Chronos, Moment, Lag-Llama e Moirai, oferecem capacidades sofisticadas, aproveitando arquiteturas de transformadores e conjuntos de dados de treinamento diversificados para análise e previsão precisas. Esses modelos fornecem uma visão do futuro da análise de séries temporais, dotando empresas e pesquisadores de ferramentas poderosas para navegar paisagens de dados complexas de forma eficaz.


