Connect with us

Sự trỗi dậy của các mô hình nền tảng chuỗi thời gian cho phân tích và dự báo dữ liệu

Công cụ AI 101

Sự trỗi dậy của các mô hình nền tảng chuỗi thời gian cho phân tích và dự báo dữ liệu

mm

Chuỗi thời gian dự báo đóng vai trò quan trọng trong các quy trình ra quyết định quan trọng trên các ngành công nghiệp khác nhau như bán lẻ, tài chính, sản xuất và chăm sóc sức khỏe. Tuy nhiên, so với các lĩnh vực như xử lý ngôn ngữ tự nhiênnhận dạng hình ảnh, việc tích hợp các kỹ thuật trí tuệ nhân tạo (AI) tiên tiến vào dự báo chuỗi thời gian đã tương đối chậm. Mặc dù mô hình AI nền tảng đã đạt được tiến bộ đáng kể trong các lĩnh vực như xử lý ngôn ngữ tự nhiên và nhận dạng hình ảnh, nhưng tác động của nó đối với dự báo chuỗi thời gian đã bị giới hạn cho đến gần đây. Tuy nhiên, hiện nay có một động lực ngày càng tăng trong việc phát triển các mô hình nền tảng cụ thể cho dự báo chuỗi thời gian. Bài viết này sẽ thảo luận về cảnh quan đang phát triển của AI nền tảng cho dự báo chuỗi thời gian, khám phá các tiến bộ gần đây trong lĩnh vực này.

Dự báo chuỗi thời gian và ứng dụng

Dữ liệu chuỗi thời gian đề cập đến một chuỗi các điểm dữ liệu được thu thập hoặc ghi lại tại các khoảng thời gian đều đặn. Loại dữ liệu này phổ biến trên các lĩnh vực khác nhau, chẳng hạn như kinh tế, thời tiết, sức khỏe và nhiều hơn nữa. Mỗi điểm dữ liệu trong một chuỗi thời gian được gắn thẻ thời gian, và chuỗi thường được sử dụng để phân tích xu hướng, mẫu và biến động theo mùa theo thời gian.

Dự báo chuỗi thời gian liên quan đến việc sử dụng dữ liệu lịch sử để dự đoán các giá trị tương lai trong chuỗi. Đây là một phương pháp quan trọng trong thống kê và học máy giúp đưa ra quyết định thông minh dựa trên các mẫu trong quá khứ. Dự báo có thể đơn giản như dự đoán tốc độ tăng trưởng tương tự trong tương lai hoặc phức tạp như sử dụng mô hình AI để dự đoán xu hướng tương lai dựa trên các mẫu và yếu tố bên ngoài phức tạp.

Một số ứng dụng của dự báo chuỗi thời gian là:

  • Thị trường tài chính: Trong lĩnh vực tài chính, dự báo chuỗi thời gian được sử dụng để dự đoán giá cổ phiếu, tỷ giá hối đoái và xu hướng thị trường. Các nhà đầu tư và nhà phân tích sử dụng dữ liệu lịch sử để dự đoán chuyển động tương lai và đưa ra quyết định giao dịch.
  • Dự báo thời tiết: Các bộ phận khí tượng sử dụng dữ liệu chuỗi thời gian để dự đoán điều kiện thời tiết. Bằng cách phân tích dữ liệu thời tiết trong quá khứ, họ dự đoán mẫu thời tiết tương lai, giúp lập kế hoạch và đưa ra quyết định cho nông nghiệp, du lịch và quản lý thảm họa.
  • Bán hàng và Tiếp thị: Các doanh nghiệp sử dụng dự báo chuỗi thời gian để dự đoán doanh số, nhu cầu và hành vi của người tiêu dùng. Điều này giúp quản lý hàng tồn kho, đặt mục tiêu bán hàng và phát triển chiến lược tiếp thị.
  • Ngành năng lượng: Các công ty năng lượng dự đoán nhu cầu và cung để tối ưu hóa sản xuất và phân phối. Dự báo chuỗi thời gian giúp dự đoán mẫu tiêu thụ năng lượng, cho phép quản lý năng lượng hiệu quả và lập kế hoạch.
  • Chăm sóc sức khỏe: Trong lĩnh vực chăm sóc sức khỏe, dự báo chuỗi thời gian được sử dụng để dự đoán sự bùng phát của bệnh, nhập viện và nhu cầu hàng hóa y tế. Điều này hỗ trợ lập kế hoạch chăm sóc sức khỏe, phân bổ nguồn lực và ra quyết định chính sách.

Mô hình nền tảng chuỗi thời gian

Mô hình AI nền tảng là các mô hình rộng lớn, được đào tạo trước đó, hình thành cơ sở cho các ứng dụng trí tuệ nhân tạo khác nhau. Chúng được đào tạo trên các tập dữ liệu lớn và đa dạng, cho phép chúng nhận ra mẫu, kết nối và cấu trúc trong dữ liệu. Thuật ngữ “nền tảng” đề cập đến khả năng của chúng trong việc được tinh chỉnh hoặc sửa đổi cho các nhiệm vụ hoặc lĩnh vực với đào tạo bổ sung tối thiểu. Trong bối cảnh dự báo chuỗi thời gian, các mô hình này được xây dựng tương tự như mô hình ngôn ngữ lớn (LLM), sử dụng kiến trúc transformer. Giống như LLM, chúng được đào tạo để dự đoán phần tử tiếp theo hoặc bị thiếu trong một chuỗi dữ liệu. Tuy nhiên, không giống như LLM, chúng xử lý chuỗi thời gian liên tục dưới dạng token, cho phép chúng xử lý tuần tự dữ liệu chuỗi thời gian.

Gần đây, các mô hình nền tảng khác nhau đã được phát triển cho dữ liệu chuỗi thời gian. Với sự hiểu biết và lựa chọn mô hình nền tảng phù hợp, chúng ta có thể tận dụng hiệu quả và hiệu quả hơn khả năng của chúng. Trong các phần tiếp theo, chúng ta sẽ khám phá các mô hình nền tảng khác nhau có sẵn cho phân tích dữ liệu chuỗi thời gian.

  • TimesFM: Được phát triển bởi Google Research, TimesFM là một mô hình nền tảng chỉ giải mã với 200 triệu tham số. Mô hình được đào tạo trên một tập dữ liệu 100 tỷ điểm thời gian thực, bao gồm cả dữ liệu tổng hợp và thực tế từ các nguồn khác nhau như Google Trends và Wikipedia Pageviews. TimesFM có khả năng dự báo không cần huấn luyện trong nhiều lĩnh vực, bao gồm bán lẻ, tài chính, sản xuất, chăm sóc sức khỏe và khoa học tự nhiên, trên các độ hạt thời gian khác nhau. Google dự kiến sẽ phát hành TimesFM trên nền tảng Google Cloud Vertex AI, cung cấp các tính năng dự báo tiên tiến cho khách hàng bên ngoài.
  • Lag-Llama: Được tạo bởi các nhà nghiên cứu từ Université de Montréal, Mila-Québec AI Institute và McGill University, Lag-Llama là một mô hình nền tảng được thiết kế cho dự báo chuỗi thời gian xác suất đơn biến. Xây dựng trên nền tảng Llama, mô hình sử dụng kiến trúc transformer chỉ giải mã, sử dụng độ trễ thời gian và độ phân giải thời gian biến đổi cho dự báo. Mô hình được đào tạo trên các tập dữ liệu chuỗi thời gian đa dạng từ nhiều nguồn khác nhau trên sáu nhóm khác nhau, bao gồm năng lượng, giao thông, kinh tế, thiên nhiên, chất lượng không khí và hoạt động đám mây. Mô hình này có thể được truy cập thuận tiện thông qua thư viện Huggingface.
  • Moirai: Được phát triển bởi Salesforce AI Research, Moirai là một mô hình nền tảng chuỗi thời gian được thiết kế cho dự báo phổ quát. Moirai được đào tạo trên tập dữ liệu Lưu trữ Mở Chuỗi Thời gian Lớn (LOTSA), chứa 27 tỷ quan sát từ chín lĩnh vực khác nhau, làm cho nó trở thành bộ sưu tập lớn nhất của các tập dữ liệu chuỗi thời gian mở. Tập dữ liệu đa dạng này cho phép Moirai học hỏi từ một loạt các dữ liệu chuỗi thời gian, cho phép nó xử lý các nhiệm vụ dự báo khác nhau. Moirai sử dụng nhiều lớp dự án kích thước bản vá để bắt các mẫu thời gian trên các tần số khác nhau. Một khía cạnh quan trọng của Moirai là sử dụng cơ chế chú ý bất kỳ biến, cho phép dự báo trên bất kỳ số biến nào. Mã, trọng số mô hình và dữ liệu liên quan đến Moirai có sẵn trong kho lưu trữ GitHub có tên “uni2ts
  • Chronos: Được phát triển bởi Amazon, Chronos là một bộ sưu tập các mô hình xác suất được đào tạo trước cho dự báo chuỗi thời gian. Xây dựng trên kiến trúc transformer T5, các mô hình sử dụng từ vựng 4096 token và có các tham số khác nhau, từ 8 triệu đến 710 triệu. Chronos được đào tạo trước trên một lượng lớn dữ liệu công khai và dữ liệu tổng hợp được tạo từ các quá trình Gaussian. Chronos khác với TimesFM ở chỗ nó là một mô hình giải mã-đ mã, cho phép trích xuất các bản nhúng giải mã từ dữ liệu chuỗi thời gian. Chronos có thể được tích hợp dễ dàng vào môi trường Python và truy cập thông qua API của nó.
  • Moment: Được phát triển hợp tác bởi Đại học Carnegie Mellon và Đại học Pennsylvania, Moment là một họ các mô hình nền tảng chuỗi thời gian mã nguồn mở. Nó sử dụng các biến thể của kiến trúc T5, bao gồm các phiên bản nhỏ, cơ bản và lớn, với mô hình cơ bản bao gồm khoảng 125 triệu tham số. Mô hình trải qua quá trình đào tạo trước trên “Đống chuỗi thời gian”, một bộ sưu tập đa dạng của dữ liệu chuỗi thời gian công khai trên các lĩnh vực khác nhau. Không giống như nhiều mô hình nền tảng khác, MOMENT được đào tạo trước trên một loạt các nhiệm vụ, tăng cường hiệu quả của nó trong các ứng dụng như dự báo, phân loại, phát hiện bất thường và điền vào. Kho lưu trữ Python hoàn chỉnh và mã notebook Jupyter có sẵn công khai để sử dụng mô hình.

Kết luận

Dự báo chuỗi thời gian là một công cụ quan trọng trên các lĩnh vực khác nhau, từ tài chính đến chăm sóc sức khỏe, cho phép đưa ra quyết định thông minh dựa trên các mẫu trong quá khứ. Các mô hình nền tảng tiên tiến như TimesFM, Chronos, Moment, Lag-Llama và Moirai cung cấp các khả năng phức tạp, tận dụng kiến trúc transformer và các tập dữ liệu đào tạo đa dạng cho dự báo và phân tích chính xác. Những mô hình này cung cấp một cái nhìn về tương lai của phân tích chuỗi thời gian, trao quyền cho các doanh nghiệp và nhà nghiên cứu với các công cụ mạnh mẽ để điều hướng các cảnh quan dữ liệu phức tạp một cách hiệu quả.

Tiến sĩ Tehseen Zia là Giáo sư Liên kết có thời hạn tại Đại học COMSATS Islamabad, nắm giữ bằng Tiến sĩ về Trí tuệ Nhân tạo từ Đại học Công nghệ Vienna, Áo. Chuyên về Trí tuệ Nhân tạo, Học máy, Khoa học Dữ liệu và Thị giác Máy tính, ông đã có những đóng góp đáng kể với các ấn phẩm trên các tạp chí khoa học uy tín. Tiến sĩ Tehseen cũng đã dẫn dắt các dự án công nghiệp khác nhau với tư cách là Điều tra viên Chính và từng là Tư vấn viên Trí tuệ Nhân tạo.