Connect with us

Kumo Ra Mắt KumoRFM-2, Một Mô Hình Cơ Bản Được Thiết Kế Để Thay Thế Học Máy Truyền Thống Của Doanh Nghiệp

Thông báo

Kumo Ra Mắt KumoRFM-2, Một Mô Hình Cơ Bản Được Thiết Kế Để Thay Thế Học Máy Truyền Thống Của Doanh Nghiệp

mm

Kumo đã ra mắt KumoRFM-2, một mô hình cơ bản thế hệ tiếp theo được thiết kế đặc biệt cho dữ liệu doanh nghiệp có cấu trúc — đánh dấu một bước ngoặt cơ bản trong cách các tổ chức tạo ra dự đoán từ kho dữ liệu của họ. Không giống như các đường ống học máy truyền thống đòi hỏi phải mất nhiều tháng để xây dựng tính năng và phát triển mô hình tùy chỉnh, KumoRFM-2 cho phép các nhóm tạo ra dự đoán ngay lập tức bằng ngôn ngữ tự nhiên, mà không cần đào tạo hoặc chuyên môn đặc biệt.

Tại cốt lõi, mô hình này đại diện cho một loại AI mới: một mô hình cơ bản quan hệ hoạt động trực tiếp trên cấu trúc dữ liệu doanh nghiệp thay vì làm phẳng chúng thành các bảng đơn giản. Sự khác biệt này giải quyết một trong những hạn chế dai dẳng nhất trong AI doanh nghiệp, nơi các mối quan hệ quý giá giữa các tập dữ liệu thường bị mất trước khi mô hình hóa thậm chí bắt đầu.

Từ Đường Ống Tĩnh Đến Hệ Thống Dự Báo Thời Gian Thực

Phân tích dự báo doanh nghiệp đã từng là một quá trình chậm và tốn nhiều tài nguyên. Mỗi trường hợp sử dụng mới — cho dù đó là dự đoán chuyển đổi, phát hiện gian lận, hoặc dự báo nhu cầu — thường đòi hỏi một đường ống riêng, bao gồm làm sạch dữ liệu, xây dựng tính năng, đào tạo mô hình và điều chỉnh.

KumoRFM-2 thay thế toàn bộ quy trình làm việc bằng một hệ thống đã được đào tạo trước.
Thay vì xây dựng mô hình, người dùng xác định những gì họ muốn dự đoán. Mô hình này diễn giải yêu cầu, xây dựng ngữ cảnh cần thiết từ cơ sở dữ liệu cơ bản và tạo ra dự đoán trong một lần đi qua. Điều này được thực hiện có thể thông qua sự kết hợp của học trong ngữ cảnh và một giao diện khai báo gọi là Ngôn ngữ Truy vấn Dự báo (PQL), nơi người dùng thể hiện kết quả họ quan tâm thay vì các bước cần thiết để tính toán nó.

Kết quả là một sự thay đổi từ “xây dựng mô hình” sang “đặt câu hỏi” — một sự thay đổi làm giảm đáng kể rào cản khi sử dụng AI dự báo trên toàn tổ chức.

Tại Sao Dữ Liệu Quan Hệ Đã Khó Được Xử Lý

Hầu hết các hệ thống AI hiện có gặp khó khăn với dữ liệu doanh nghiệp có cấu trúc vì một lý do đơn giản: chúng xử lý dữ liệu một cách không chính xác.

Các mô hình truyền thống, bao gồm cả các hệ thống AI bảng và thậm chí các mô hình ngôn ngữ lớn, dựa vào việc làm phẳng dữ liệu thành một bảng đơn. Nhưng dữ liệu doanh nghiệp thực tế tồn tại dưới dạng các hệ thống liên kết — khách hàng liên kết với giao dịch, giao dịch liên kết với sản phẩm, sản phẩm liên kết với hàng tồn kho, tất cả đều thay đổi theo thời gian.

Việc làm phẳng cấu trúc này loại bỏ các mối quan hệ thường chứa các tín hiệu dự báo quý giá nhất. Nó cũng buộc các nhóm phải tự tạo lại các tín hiệu này thông qua kỹ thuật tính năng, một quá trình vừa tốn thời gian vừa dễ bị lỗi.

KumoRFM-2 tránh điều này hoàn toàn bằng cách hoạt động trực tiếp trên cơ sở dữ liệu quan hệ, bảo tồn các kết nối trên các bảng, dấu thời gian và thực thể.

Inside Kiến Trúc: Cách KumoRFM-2 Hoạt Động

Chìa khóa đổi mới đằng sau KumoRFM-2 là kiến trúc Biến Hình Quan Hệ Graph phân cấp của nó, xử lý dữ liệu ở nhiều cấp độ đồng thời.

Ở cấp độ đầu tiên, mô hình này phân tích từng bảng bằng cách kết hợp sự chú ý hàng và cột. Điều này cho phép nó hiểu cách các tính năng liên quan trong một bảng trong khi lọc ra dữ liệu không liên quan hoặc nhiễu sớm trong quá trình. Quan trọng, mục tiêu dự đoán được giới thiệu tại giai đoạn này, có nghĩa là mô hình được điều kiện hóa cho nhiệm vụ ngay từ đầu.

Ở cấp độ thứ hai, mô hình này thực hiện lý luận dựa trên đồ thị trên các bảng. Sử dụng các mối quan hệ khóa ngoại, nó kết nối dữ liệu từ các phần khác nhau của cơ sở dữ liệu — chẳng hạn như liên kết hồ sơ khách hàng với lịch sử mua hàng hoặc mẫu hành vi — và xác định các tín hiệu giữa bảng mà nếu không sẽ bị mất.

Ở cấp độ thứ ba, mô hình này kết hợp sự chú ý giữa các mẫu, cho phép nó học từ nhiều ví dụ cùng một lúc. Điều này cho phép nó khái quát hóa từ một số ví dụ ngữ cảnh tương đối nhỏ, thay vì yêu cầu toàn bộ tập dữ liệu đào tạo.

Thiết kế giai đoạn này là rất quan trọng. Nó tránh được sự bùng nổ tính toán sẽ xảy ra khi xử lý mọi điểm dữ liệu đồng thời, đồng thời cải thiện độ chính xác bằng cách lọc nhiễu trước khi lý luận sâu hơn xảy ra.

Học Trong Ngữ Cảnh Thay Thế Đào Tạo

Một tính năng định nghĩa của KumoRFM-2 là sự phụ thuộc vào học trong ngữ cảnh thay vì đào tạo truyền thống.

Thay vì đào tạo một mô hình cho mỗi nhiệm vụ, KumoRFM-2 được đào tạo trước một lần trên một hỗn hợp lớn của dữ liệu tổng hợp và dữ liệu thế giới thực quan hệ. Khi người dùng gửi một yêu cầu dự đoán, hệ thống tự động tạo một tập các ví dụ ngữ cảnh — các subgraph nhỏ của cơ sở dữ liệu được ghép nối với kết quả đã biết.

Những ví dụ này đóng vai trò là hướng dẫn cho mô hình, cho phép nó suy luận ra các mẫu và tạo ra dự đoán mà không cần cập nhật trọng số của nó. Trong thực tế, điều này có nghĩa là:

  • Không cần đào tạo cụ thể cho nhiệm vụ
  • Không cần kỹ thuật tính năng
  • Không cần điều chỉnh mô hình

Thậm chí với chỉ 0,2% dữ liệu thường được yêu cầu cho học có giám sát, mô hình có thể đạt được hiệu suất hàng đầu.

Hiệu Suất Trên Các Benchmark Thực Tế

KumoRFM-2 đã được đánh giá trên 41 nhiệm vụ dự báo khác nhau trong các ngành như thương mại điện tử, chăm sóc sức khỏe, nền tảng xã hội và hệ thống doanh nghiệp.

Mô hình này nhất quán vượt trội so với các phương pháp học máy có giám sát truyền thống, bao gồm cả các tập hợp được thiết kế và các hệ thống học sâu quan hệ. Trên các chuẩn mực doanh nghiệp, nó vượt qua các giải pháp được sử dụng rộng rãi bằng các biên độ đáng kể, đồng thời cải thiện hơn nữa khi được tinh chỉnh.

Ngoài độ chính xác thô, mô hình này chứng tỏ sự mạnh mẽ:

  • Giữ hiệu suất ngay cả khi mất nhiều liên kết quan hệ
  • Xử lý dữ liệu nhiễu hoặc không đầy đủ với sự suy giảm tối thiểu
  • Hoạt động tốt trong các kịch bản khởi động lạnh nơi dữ liệu lịch sử bị hạn chế

Sự vững chắc này đặc biệt quan trọng trong môi trường doanh nghiệp, nơi chất lượng dữ liệu thường không nhất quán.

Xây Dựng Để Tăng Tốc: Lên Đến 500 Tỷ Hàng

KumoRFM-2 được thiết kế để hoạt động ở quy mô của cơ sở hạ tầng dữ liệu hiện đại.

Hệ thống này có thể xử lý các tập dữ liệu vượt quá 500 tỷ hàng bằng cách kết hợp thực hiện bản địa cơ sở dữ liệu với một máy tính đồ thị tùy chỉnh có khả năng truy cập dữ liệu với tốc độ cao. Thay vì di chuyển dữ liệu vào một hệ thống ML riêng biệt, tính toán được đẩy trực tiếp đến nơi dữ liệu cư trú — cho dù trong cơ sở dữ liệu SQL hay nhà kho dữ liệu đám mây.

Cách tiếp cận này giảm độ trễ, đơn giản hóa việc triển khai và cho phép các tổ chức tích hợp khả năng dự báo vào các quy trình làm việc hiện có.

Ngôn Ngữ Tự Nhiên Là Giao Diện

Một tính năng định nghĩa khác là giao diện ngôn ngữ tự nhiên của mô hình.

Người dùng có thể đặt câu hỏi như:

  • Khách hàng nào có khả năng chuyển đổi trong 30 ngày tới?
  • Đầu mối nào có khả năng chuyển đổi cao nhất?
  • Sản phẩm nào sẽ thấy nhu cầu tăng?

Hệ thống này dịch các truy vấn này thành logic dự báo có cấu trúc, thực hiện chúng trên dữ liệu cơ bản và trả về cả dự đoán và giải thích.

Điều này không chỉ làm cho phân tích dự báo trở nên dễ tiếp cận hơn, mà còn cho phép tích hợp với các tác nhân AI, nơi dự đoán có thể được nhúng vào các quy trình ra quyết định tự động.

Hướng Đến Trí Tuệ Doanh Nghiệp Được Động Viên Bởi Tác Nhân

KumoRFM-2 được thiết kế với các tác nhân trong tâm trí.

Khả năng dự báo của nó có thể được hiển thị như các “kỹ năng” mô-đun mà các tác nhân AI có thể gọi như một phần của các quy trình làm việc lớn hơn. Điều này biến mô hình hóa dự báo thành một khối xây dựng có thể kết hợp — một thứ gì đó có thể được kết hợp với thu hồi, lý luận và thực hiện trong các hệ thống tự động.

Định Nghĩa Lại Vai Trò Của Khoa Học Dữ Liệu

KumoRFM-2 báo hiệu một sự thay đổi rộng lớn hơn trong cách các tổ chức tiếp cận khoa học dữ liệu.

Thay vì xây dựng và duy trì hàng chục mô hình cụ thể cho từng nhiệm vụ, các nhóm có thể dựa vào một hệ thống chung, đa năng có thể thích nghi với các vấn đề mới ngay lập tức. Điều này giảm nhu cầu về chuyên môn đặc biệt trong kỹ thuật tính năng và điều chỉnh mô hình, đồng thời cho phép thử nghiệm và lặp lại nhanh hơn.

Đối với nhiều tổ chức, điều này có thể có nghĩa là chuyển từ một chức năng khoa học dữ liệu tập trung sang một mô hình phân tán hơn, nơi các thông tin dự báo có thể được truy cập trên nhiều bộ phận.

Một Loại Mới Của Các Mô Hình Cơ Bản

Mặc dù các mô hình cơ bản đã biến đổi các lĩnh vực như ngôn ngữ và tầm nhìn, dữ liệu doanh nghiệp có cấu trúc vẫn còn là một trong những biên giới cuối cùng.

KumoRFM-2 đại diện cho một ví dụ sớm về những gì các mô hình cơ bản chuyên dụng cho dữ liệu có cấu trúc có thể đạt được. Bằng cách kết hợp lý luận quan hệ, học trong ngữ cảnh và tương tác ngôn ngữ tự nhiên, nó giới thiệu một mô hình mới cho AI dự báo.

Nếu được áp dụng rộng rãi, cách tiếp cận này có thể định nghĩa lại cách các doanh nghiệp tương tác với dữ liệu của họ — biến phân tích dự báo từ một quá trình phức tạp, chậm chạp thành một khả năng thời gian thực trên toàn tổ chức.

Antoine là một nhà lãnh đạo có tầm nhìn và là đối tác sáng lập của Unite.AI, được thúc đẩy bởi một niềm đam mê không ngừng nghỉ để định hình và thúc đẩy tương lai của AI và robot. Là một doanh nhân liên tục, ông tin rằng AI sẽ gây ra sự gián đoạn cho xã hội giống như điện, và thường bị bắt gặp nói về tiềm năng của các công nghệ gây gián đoạn và AGI.
Như một futurist, ông dành để khám phá cách những đổi mới này sẽ định hình thế giới của chúng ta. Ngoài ra, ông là người sáng lập của Securities.io, một nền tảng tập trung vào đầu tư vào các công nghệ tiên tiến đang định nghĩa lại tương lai và thay đổi toàn bộ lĩnh vực.