Connect with us

Backboard Thiết Lập Tiêu Chuẩn Toàn Cầu Mới Trong Bộ Nhớ AI — Một Bước Nhảy Vĩ Đại Hướng Đến Trí Tuệ Nhân Tạo Thực Sự

Trí tuệ nhân tạo

Backboard Thiết Lập Tiêu Chuẩn Toàn Cầu Mới Trong Bộ Nhớ AI — Một Bước Nhảy Vĩ Đại Hướng Đến Trí Tuệ Nhân Tạo Thực Sự

mm

Backboard đã vượt qua một ngưỡng quan trọng đối với các hệ thống trí tuệ nhân tạo bằng cách chứng minh rằng bộ nhớ có thể được coi là cơ sở hạ tầng cốt lõi chứ không phải là một thành phần dễ vỡ. Công ty đã công bố rằng hiện nay họ dẫn đầu cả hai tiêu chuẩn đánh giá bộ nhớ AI chính, LoCoMo và LongMemEval, trở thành nền tảng đầu tiên làm được điều này dưới các phương pháp đánh giá học thuật và độc lập.

Trong một đánh giá độc lập do NewMathData thực hiện, Backboard đã đạt được độ chính xác 93,4% trên LongMemEval, kết quả cao nhất được công bố công khai cho đến nay khi chạy theo thông số kỹ thuật ban đầu của tiêu chuẩn. Kết quả này xây dựng trên cơ sở điểm số 90,1% trước đó được công bố trên LoCoMo, đặt Backboard vào một nhóm nhỏ các hệ thống có khả năng duy trì cả độ chính xác ngắn hạn và tính liên tục ngữ cảnh dài hạn.

Đáng chú ý, các nhà đánh giá đã xác định nhiều trường hợp Backboard trả lời sai mặc dù câu trả lời của nó chính xác hơn về mặt ngữ cảnh so với câu trả lời dự kiến của tiêu chuẩn. Trong những trường hợp này, hệ thống đã kết hợp thông tin thực tế đã có trong quá trình tương tác thay vì tuân theo cách giải thích hẹp hơn của lời nhắc. Do đó, điểm số được báo cáo đại diện cho một baseline bảo thủ chứ không phải giới hạn hiệu suất trên.

Tại sao bộ nhớ đã trở thành yếu tố hạn chế trong AI

Hầu hết các hệ thống AI hiện đại vẫn hành động như thể chúng không có quá khứ thực sự. Mặc dù các mô hình ngôn ngữ lớn rất giỏi trong việc tạo ra các phản hồi trôi chảy, chúng thường quên ngữ cảnh một khi phiên kết thúc hoặc cửa sổ lời nhắc được lấp đầy. Giới hạn này buộc các nhà phát triển phải xây dựng lại trạng thái một cách lặp đi lặp lại thông qua các thủ thuật thu hồi, kỹ thuật lời nhắc hoặc chuỗi công cụ giòn có thể bị hỏng khi hệ thống trở nên phức tạp hơn.

Bộ nhớ không chỉ là về việc nhớ lại. Trong các triển khai thực tế, bộ nhớ quyết định liệu một hệ thống AI có thể duy trì tính nhất quán theo thời gian, phối hợp trên các nhiệm vụ và xây dựng niềm tin với người dùng hay không. Không có bộ nhớ bền vững, các hệ thống sẽ bị đặt lại, ảo giác, hoặc mâu thuẫn với chính mình. Khi AI chuyển từ các tương tác một lượt sang các quy trình chạy dài, bộ nhớ đã trở thành nút thắt chính.

Backboard tiếp cận vấn đề này bằng cách coi bộ nhớ là cơ sở hạ tầng cấp một. Thay vì gắn bộ nhớ vào lớp ứng dụng, nó tích hợp sự bền bỉ, nhúng, thu hồi và điều phối vào một nền tảng thống nhất được truy cập thông qua một API duy nhất.

Một cách tiếp cận cấp hệ thống thay vì điều chỉnh tiêu chuẩn

Backboard không thiết kế kiến trúc của mình để theo đuổi điểm số tiêu chuẩn. Các đánh giá đã được khởi xướng độc lập hoặc sử dụng nội bộ để hiểu cách hệ thống so sánh với nghiên cứu học thuật. Hiệu suất kết quả phản ánh hành vi cấp hệ thống trong điều kiện thực tế chứ không phải tối ưu hóa nhiệm vụ cụ thể.

Sự khác biệt này rất quan trọng vì hầu hết các tiêu chuẩn đo lường hành vi của mô hình trong cô lập, trong khi các hệ thống AI thực tế được cấu thành từ nhiều bộ phận chuyển động. Kết quả của Backboard cho thấy hiệu suất bộ nhớ không chỉ là một hàm của kích thước mô hình hoặc tính toán cưỡng bức, mà là cách bộ nhớ được cấu trúc, cập nhật và chia sẻ theo thời gian.

Nền tảng kết hợp bộ nhớ dài hạn bền vững, nhúng bản địa và vector hóa, tạo ra tăng cường thu hồi, bộ nhớ chia sẻ trên các tác nhân và truy cập vào hơn 17.000 mô hình ngôn ngữ lớn, bao gồm hỗ trợ mang theo khóa của riêng bạn. Bằng cách thống nhất các yếu tố này, Backboard loại bỏ nhu cầu của các doanh nghiệp phải khâu các thành phần mã nguồn mở lại với nhau, những thành phần thường thất bại dưới các ràng buộc sản xuất.

Làm cho AI có tính đại lý trở nên thực tế

Sự quan tâm đến AI có tính đại lý tiếp tục tăng, nhưng hầu hết các triển khai đều gặp khó khăn trong việc vượt ra ngoài các bản demo. Lý do rất đơn giản. Các đại lý không có bộ nhớ chia sẻ và bền vững không thể phối hợp hiệu quả. Họ bị phân mảnh, mất ngữ cảnh và hành động không thể đoán trước khi các tương tác kéo dài theo thời gian.

Backboard cho phép bộ nhớ chia sẻ và bền vững trên các đại lý ngay cả khi các đại lý đó dựa trên các mô hình cơ bản khác nhau. Khi bộ nhớ đáng tin cậy, hành vi có tính đại lý xuất hiện một cách tự nhiên chứ không phải được kịch bản hóa. Các hệ thống có thể nhớ lại các quyết định trước đó, duy trì tính liên tục trên các phiên và phối hợp hành động mà không cần nhắc lại liên tục.

Khung bộ nhớ cơ bản của nền tảng được thiết kế để bảo tồn sự nhất quán thời gian thay vì xây dựng lại trạng thái thông qua đồ thị tĩnh hoặc thu hồi lặp lại. Điều này cho phép các hệ thống AI vẫn nhất quán và có thể kiểm toán khi chúng phát triển về độ phức tạp.

Xây dựng cho các hệ thống không thể quên

Kiến trúc của Backboard được bắt nguồn từ kinh nghiệm của người sáng lập và CEO, Rob Imbeault, người trước đây đã giúp xây dựng Assent từ một công ty khởi nghiệp giai đoạn đầu thành một nền tảng doanh nghiệp toàn cầu có giá trị hơn 1,4 tỷ đô la. Tại Assent, các hệ thống Imbeault làm việc đã được nhúng sâu vào các hoạt động của khách hàng, hỗ trợ tuân thủ quy định và các quy trình chuỗi cung ứng phức tạp, nơi tính liên tục, chính xác và tin cậy là không thể thương lượng.

Kinh nghiệm đó đã hình thành một niềm tin rõ ràng. Cơ sở hạ tầng có giá trị nhất thường không phải là thứ bóng bẩy. Đó là cơ sở hạ tầng hoạt động im lặng, nhất quán và trong thời gian dài. Trong những môi trường đó, các hệ thống không được phép đặt lại khi ngữ cảnh bị mất. Nếu trạng thái biến mất hoặc niềm tin bị xói mòn, hệ thống thất bại về mặt hoạt động, không chỉ về mặt kỹ thuật.

Imbeault đã thấy một sự không phù hợp cấu trúc xuất hiện trong AI hiện đại. Mặc dù các mô hình ngôn ngữ lớn đã phát triển nhanh chóng, chúng vẫn cơ bản là không có trạng thái. Ngữ cảnh biến mất giữa các phiên, buộc các nhà phát triển phải xây dựng lại bộ nhớ thông qua các chuỗi lời nhắc giòn và các lớp thu hồi ad hoc. Những cách tiếp cận này có thể hoạt động trong các bản demo, nhưng chúng bị hỏng khi các hệ thống AI được dự kiến sẽ chạy liên tục, phối hợp trên các đại lý và phát triển theo thời gian.

Backboard được xây dựng để lấp đầy khoảng trống đó. Bộ nhớ được coi là cơ sở hạ tầng bền vững chứ không phải logic ứng dụng, cho phép các hệ thống AI duy trì trạng thái trên các tương tác, mô hình và đại lý. Sự tập trung vào tính bền bỉ, chính xác và độ tin cậy lâu dài phản ánh một niềm tin được hình thành từ lâu trước khi Backboard tồn tại: trong các môi trường sản xuất, các lỗi bộ nhớ không phải là các khiếm khuyết nhỏ. Chúng là rủi ro hệ thống.

Quan điểm này là nền tảng cho triết lý thiết kế của Backboard. Mục tiêu không phải là展示 trí thông minh trong những khoảnh khắc cô lập, mà là cho phép các hệ thống AI hành động như phần mềm đáng tin cậy, ngay cả khi độ phức tạp tăng và đường chân trời thời gian mở rộng.

Điều này có nghĩa là gì cho tương lai của AI

Áp dụng rộng rãi của kết quả Backboard là rằng giai đoạn tiếp theo của tiến bộ AI sẽ không được thúc đẩy chỉ bởi các mô hình lớn hơn hoặc cửa sổ ngữ cảnh dài hơn. Nó sẽ được thúc đẩy bởi các hệ thống có thể nhớ, suy luận và phát triển theo thời gian.

Khi các doanh nghiệp triển khai AI trên hỗ trợ khách hàng, hoạt động, nghiên cứu và tuân thủ, bộ nhớ bền vững trở thành nền tảng cho sự tin cậy và khả năng mở rộng. Các nền tảng giải quyết bộ nhớ ở cấp độ cơ sở hạ tầng sẽ định hình cách AI có tính đại lý chuyển từ thử nghiệm sang sử dụng hàng ngày.

Với kiến trúc bộ nhớ của mình đã được xác thực trên cả các tiêu chuẩn học thuật và độc lập, Backboard đang chuyển sự chú ý của mình sang giúp các nhóm hiểu và đánh giá tốt hơn hành vi của hệ thống AI dưới các ràng buộc thực tế. Khả năng Switchboard sắp tới của công ty nhằm mục đích làm cho các cấu hình AI phức tạp trở nên minh bạch và có thể dự đoán hơn.

Tương lai của AI sẽ được định hình ít hơn bởi các thủ thuật lời nhắc thông minh và nhiều hơn bởi các hệ thống có thể được tin cậy theo thời gian. Bộ nhớ là nền tảng của sự thay đổi đó, và kết quả mới nhất của Backboard cho thấy rằng nền tảng này cuối cùng đã bắt đầu hình thành.

Antoine là một nhà lãnh đạo có tầm nhìn và là đối tác sáng lập của Unite.AI, được thúc đẩy bởi một niềm đam mê không ngừng nghỉ để định hình và thúc đẩy tương lai của AI và robot. Là một doanh nhân liên tục, ông tin rằng AI sẽ gây ra sự gián đoạn cho xã hội giống như điện, và thường bị bắt gặp nói về tiềm năng của các công nghệ gây gián đoạn và AGI.
Như một futurist, ông dành để khám phá cách những đổi mới này sẽ định hình thế giới của chúng ta. Ngoài ra, ông là người sáng lập của Securities.io, một nền tảng tập trung vào đầu tư vào các công nghệ tiên tiến đang định nghĩa lại tương lai và thay đổi toàn bộ lĩnh vực.