인공 지능

데이터 분석 및 예측을 위한 시계열 기반 모델의 부상

업데이트 on 2024 년 4 월 4 일

시계열 예측 소매, 금융, 제조, 의료 등 다양한 산업 전반에 걸쳐 중요한 의사결정 프로세스에서 중요한 역할을 합니다. 그러나 다음과 같은 도메인에 비해 자연어 처리 과 이미지 인식, 고급 인공지능(AI) 기술을 시계열 예측에 통합하는 것은 상대적으로 느렸습니다. 하지만 기초 AI 자연어 처리 및 이미지 인식과 같은 분야에서 상당한 진전을 이루었지만 시계열 예측에 대한 영향은 최근까지 제한적이었습니다. 그럼에도 불구하고, 시계열 예측을 위해 특별히 맞춤화된 기본 모델 개발에 점점 더 많은 추진력이 있습니다. 이 기사의 목적은 시계열 예측을 위한 기본 AI의 진화하는 환경을 조사하고 이 영역의 최근 발전을 살펴보는 것입니다. 그러나 이러한 발전에 대해 자세히 알아보기 전에 시계열 예측과 다양한 산업에서의 적용에 대해 간략하게 소개하겠습니다.

시계열 예측 및 응용

시계열 데이터는 일정한 시간 간격으로 수집되거나 기록된 일련의 데이터 포인트를 의미합니다. 이러한 유형의 데이터는 경제, 날씨, 건강 등과 같은 다양한 영역에 널리 퍼져 있습니다. 시계열의 각 데이터 포인트에는 타임스탬프가 표시되며, 시퀀스는 시간 경과에 따른 추세, 패턴 및 계절적 변동을 분석하는 데 자주 사용됩니다.

시계열 예측에는 과거 데이터를 사용하여 계열의 미래 값을 예측하는 작업이 포함됩니다. 이는 과거 패턴을 기반으로 정보에 입각한 결정을 내리는 데 도움이 되는 통계 및 기계 학습의 중요한 방법입니다. 예측은 미래에 동일한 성장률을 예측하는 것처럼 간단할 수도 있고 AI 모델을 사용하여 복잡한 패턴과 외부 요인을 기반으로 미래 추세를 예측하는 것처럼 복잡할 수도 있습니다.

시계열 예측의 일부 응용 프로그램은 다음과 같습니다.

금융 시장: 금융에서는 시계열 예측을 사용하여 주가, 환율, 시장 추세를 예측합니다. 투자자와 분석가는 과거 데이터를 사용하여 미래 움직임을 예측하고 거래 결정을 내립니다.
일기 예보: 기상부는 시계열 데이터를 사용하여 기상 상황을 예측합니다. 과거의 기상 데이터를 분석하여 미래의 기상 패턴을 예측하고 농업, 여행, 재난 관리에 대한 계획 및 의사 결정을 돕습니다.
영업 및 마케팅 : 기업은 시계열 예측을 활용하여 미래 판매, 수요 및 소비자 행동을 예측합니다. 이는 재고 관리, 판매 목표 설정 및 마케팅 전략 개발에 도움이 됩니다.
에너지 부문: 에너지 기업은 수요와 공급을 예측하여 생산과 유통을 최적화합니다. 시계열 예측은 에너지 소비 패턴을 예측하여 효율적인 에너지 관리 및 계획을 가능하게 합니다.
건강 관리: 의료 부문에서는 시계열 예측을 사용하여 질병 발생, 환자 입원 및 의료 재고 요구 사항을 예측합니다. 이는 의료 계획, 자원 할당 및 정책 수립을 지원합니다.

기초 시계열 모델

기초 AI 모델은 다양한 인공 지능 애플리케이션의 기반을 형성하는 사전 훈련된 광범위한 모델입니다. 그들은 크고 다양한 데이터 세트에 대해 훈련을 받아 데이터 내의 패턴, 연결 및 구조를 식별할 수 있습니다. "기초"라는 용어는 최소한의 추가 교육만으로 작업이나 영역에 맞게 미세 조정하거나 수정할 수 있는 능력을 의미합니다. 시계열 예측의 맥락에서 이러한 모델은 다음과 유사하게 구성됩니다. 큰 언어 모델 (LLM), 활용 변압기 아키텍처. LLM과 마찬가지로 데이터 시퀀스에서 후속 요소 또는 누락된 요소를 예측하도록 훈련되었습니다. 그러나 변환기 레이어를 통해 텍스트를 하위 단어로 처리하는 LLM과 달리 기본 시계열 모델은 연속적인 시점의 시퀀스를 토큰으로 처리하여 시계열 데이터를 순차적으로 처리할 수 있습니다.

최근에는 시계열 데이터에 대한 다양한 기초 모델이 개발되었습니다. 적절한 기본 모델을 더 잘 이해하고 선택하면 해당 기능을 보다 효과적이고 효율적으로 활용할 수 있습니다. 후속 섹션에서는 시계열 데이터 분석에 사용할 수 있는 다양한 기본 모델을 살펴보겠습니다.

타임즈FM: Google Research에서 개발한 TimesFM은 200억 개의 매개변수를 갖춘 디코더 전용 기본 모델입니다. 이 모델은 Google Trends 및 Wikipedia Pageviews와 같은 다양한 소스의 합성 데이터와 실제 데이터를 모두 포함하는 100억 개의 실제 시점 데이터 세트에서 훈련되었습니다. TimesFM은 소매, 금융, 제조, 의료, 자연과학을 포함한 여러 부문에서 다양한 시간 단위에 걸쳐 제로샷 예측을 수행할 수 있습니다. Google은 Google Cloud Vertex AI 플랫폼에서 TimesFM을 출시하여 외부 클라이언트에게 정교한 예측 기능을 제공할 계획입니다.
래그 라마: Université de Montréal, Mila-Québec AI Institute 및 McGill University의 연구원들이 만든 Lag-Llama는 단변량 확률 시계열 예측을 위해 설계된 기본 모델입니다. Llama를 기반으로 구축된 이 모델은 예측을 위해 다양한 크기의 시간 지연 및 시간 해상도를 사용하는 디코더 전용 변환기 아키텍처를 사용합니다. 이 모델은 에너지, 교통, 경제, 자연, 대기 질, 클라우드 운영 등 6개 그룹에 걸쳐 여러 소스의 다양한 시계열 데이터세트를 통해 훈련되었습니다. 모델은 다음을 통해 편리하게 접근할 수 있습니다. 허깅페이스 라이브러리.
모이라이: Salesforce AI Research에서 개발한 Moirai는 보편적인 예측을 위해 설계된 기본 시계열 모델입니다. Moirai는 LOTSA(Large-scale Open Time Series Archive) 데이터세트에 대해 교육을 받았습니다. 이 데이터세트에는 27개의 서로 다른 도메인에서 XNUMX억 개의 관측치가 포함되어 있어 공개 시계열 데이터세트 중 가장 큰 컬렉션입니다. 이 다양한 데이터 세트를 통해 Moirai는 광범위한 시계열 데이터로부터 학습하여 다양한 예측 작업을 처리할 수 있습니다. Moirai는 여러 패치 크기 투영 레이어를 사용하여 다양한 주파수에 걸쳐 시간적 패턴을 캡처합니다. Moirai의 중요한 측면은 모든 변수 주의 메커니즘을 사용하여 모든 변수에 대한 예측을 허용한다는 것입니다. Moirai와 관련된 코드, 모델 가중치 및 데이터는 "라는 GitHub 저장소에서 사용할 수 있습니다.단위 "

Chronos: Amazon에서 개발한 Chronos는 시계열 예측을 위해 사전 훈련된 확률 모델 모음입니다. T5 변환기 아키텍처를 기반으로 구축된 이 모델은 4096개의 토큰 어휘를 사용하며 8백만에서 710억 XNUMX천만에 이르는 다양한 매개변수를 갖습니다. Chronos는 가우스 프로세스에서 생성된 광범위한 공개 및 합성 데이터에 대해 사전 훈련되었습니다. Chronos는 시계열 데이터에서 인코더 임베딩을 추출할 수 있는 인코더-디코더 모델이라는 점에서 TimesFM과 다릅니다. Chronos는 Python 환경에 쉽게 통합될 수 있으며 다음을 통해 액세스할 수 있습니다. API.

순간: Carnegie Mellon University와 University of Pennsylvania가 공동으로 개발한 Moment는 오픈 소스 기반 시계열 모델 제품군입니다. 이는 약 5억 125만 개의 매개변수를 통합한 기본 모델과 함께 소형, 기본, 대형 버전을 포함한 다양한 TXNUMX 아키텍처를 활용합니다. 이 모델은 다양한 도메인에 걸쳐 공개 시계열 데이터의 다양한 컬렉션인 광범위한 "시계열 더미"에 대한 사전 훈련을 거칩니다. 다른 많은 기본 모델과 달리 MOMENT는 광범위한 작업에 대해 사전 훈련되어 예측, 분류, 이상 탐지 및 대치와 같은 애플리케이션의 효율성을 향상시킵니다. 완전한 Python 저장소 및 Jupyter 노트북 암호 모델을 활용하기 위해 공개적으로 액세스할 수 있습니다.

히프 라인

시계열 예측은 금융부터 의료까지 다양한 영역에 걸쳐 중요한 도구로, 과거 패턴을 기반으로 정보에 입각한 의사 결정을 내릴 수 있도록 해줍니다. TimesFM, Chronos, Moment, Lag-Llama 및 Moirai와 같은 고급 기본 모델은 정확한 예측 및 분석을 위해 변환기 아키텍처와 다양한 교육 데이터 세트를 활용하여 정교한 기능을 제공합니다. 이러한 모델은 시계열 분석의 미래를 엿볼 수 있게 해주며 기업과 연구자가 복잡한 데이터 환경을 효과적으로 탐색할 수 있는 강력한 도구를 제공합니다.

다음 위로

Videoleap 리뷰: 스마트폰을 위한 최고의 AI 비디오 편집기?

놓치지 마세요.

Stability AI, Stable Audio 2.0 공개: 고급 AI 생성 오디오로 창작자 역량 강화

테신 지아 박사

Tehseen Zia 박사는 COMSATS University Islamabad의 종신 부교수이며 오스트리아 Vienna University of Technology에서 AI 박사 학위를 취득했습니다. 인공 지능, 기계 학습, 데이터 과학 및 컴퓨터 비전을 전문으로 하는 그는 평판이 좋은 과학 저널에 출판물을 발표하며 상당한 공헌을 했습니다. Tehseen 박사는 수석 연구원으로서 다양한 산업 프로젝트를 이끌었고 AI 컨설턴트로도 활동했습니다.

Unite.AI

데이터 분석 및 예측을 위한 시계열 기반 모델의 부상

인공 지능

데이터 분석 및 예측을 위한 시계열 기반 모델의 부상

차례

시계열 예측 및 응용

기초 시계열 모델

히프 라인

최근 게시물

Unite.AI

데이터 분석 및 예측을 위한 시계열 기반 모델의 부상

차례

시계열 예측 및 응용

기초 시계열 모델

히프 라인

너는 좋아할지도 모른다.

최근 게시물