Lãnh đạo tư tưởng
Khủng hoảng bộ nhớ của AI: Chúng ta đang xây dựng một kỷ nguyên đen tối kỹ thuật số.

Hàng triệu tác nhân AI đang được đưa vào các hệ thống sản xuất. Hầu như không tác nhân nào có thể chia sẻ kinh nghiệm vận hành. Đó là lý do tại sao lựa chọn kiến trúc lại quan trọng—và điều gì sẽ thay đổi nếu chúng ta lựa chọn đúng.
Vào lúc 2 giờ 06 phút chiều, một khách hàng đặt mua máy tính xách tay trực tuyến.
Hệ thống thanh toán truy vấn cơ sở dữ liệu hoạt động: lịch sử mua hàng sạch, số tiền nằm trong phạm vi bình thường, địa chỉ giao hàng đã sử dụng trước đó, thiết bị và vị trí phù hợp với các đơn hàng thành công gần đây. Mọi thứ đều bình thường. Hệ thống chấp thuận đơn hàng.
Đồng thời, một tác nhân phân tích hành vi xử lý dữ liệu luồng nhấp chuột trong kho dữ liệu của công ty. Từ phiên truy cập, nó rút ra một mô hình: người dùng truy cập trực tiếp vào URL thanh toán mà không có hành vi duyệt web hoặc so sánh sản phẩm nào. Tín hiệu này tự nó khá yếu, nhưng nó là một dấu hiệu báo trước thường gặp trong các kịch bản chiếm đoạt tài khoản khi kết hợp với các giao dịch mua hàng thông thường khác.
Bộ xử lý hành vi ghi lại quá trình diễn giải này như một kiến thức được suy ra để phân tích và huấn luyện mô hình sau này.
Nhân viên thu ngân không bao giờ nhìn thấy tín hiệu đó. Không phải vì tín hiệu không được xử lý, cũng không phải vì nó bị bỏ qua, mà vì thông tin đó nằm trong một hệ thống mà nhân viên thu ngân không tham khảo trong quá trình xác thực.
Mỗi tác nhân hoạt động chính xác dựa trên những gì nó có thể nhìn thấy. Mỗi tác nhân đều ghi dữ liệu vào hệ thống mà nó sở hữu. Nhưng thông tin mà một tác nhân thu được lại không thể nhìn thấy đối với tác nhân khác tại thời điểm ra quyết định.
Máy tính xách tay đã được vận chuyển.
Ba mươi sáu giờ sau, giao dịch bị tranh chấp. Cuộc điều tra xác nhận tài khoản đã bị xâm phạm vào đầu ngày hôm đó. Kẻ tấn công đã thực hiện giao dịch trong phạm vi bình thường, dựa vào thực tế là cảnh báo sớm duy nhất tồn tại dưới dạng thông tin hành vi bị mắc kẹt bên ngoài ngữ cảnh quyết định của nhân viên thanh toán.
Thất bại không phải do thiếu dữ liệu, xử lý chậm hay mô hình kém. Đó là do sự cô lập của các tác nhân: kiến thức được hình thành, nhưng không được chia sẻ.
Điều này phơi bày một vấn đề mà hầu như không ai nhắc đến. Chúng ta đã xây dựng những kiến trúc mà trong đó các tác nhân AI đưa ra quyết định không thể truy cập những gì các tác nhân AI khác đã khám phá ra.
Vấn đề mà máy in đã giải quyết
Trước khi có máy in, kiến thức rất dễ bị mai một. Khi một học giả qua đời, phần lớn những gì họ học được cũng biến mất theo. Một nhà toán học ở London có thể dành hàng thập kỷ để khám phá ra những nguyên lý mà một nhà toán học ở Paris sẽ độc lập tái khám phá ra năm mươi năm sau đó. Tiến bộ là có thật, nhưng nó mang tính cục bộ, chậm chạp và liên tục bị thiết lập lại.
Máy in Nó không làm cho cá nhân thông minh hơn. Nó đưa trí nhớ ra bên ngoài. Kiến thức không còn bị ràng buộc vào một trí óc duy nhất mà bắt đầu tồn tại lâu dài sau khi người tạo ra nó qua đời. Những hiểu biết có thể được chia sẻ, xem xét lại và phát triển qua nhiều thế hệ. Đó là điều cho phép sự tiến bộ được tích lũy.
Chúng ta có nguy cơ lặp lại sai lầm thời kỳ trước khi có máy in với trí tuệ nhân tạo.
Hầu hết các tổ chức hiện đang triển khai các tác nhân AI trên khắp các hệ thống sản xuất.và nhiều đơn vị khác đang tích cực thử nghiệm trong các lĩnh vực như hỗ trợ khách hàng, phát triển phần mềm, nghiên cứu và phát hiện gian lận. Các đơn vị này thường được triển khai như các dịch vụ độc lập phù hợp với các hệ thống hiện đại. kiến trúc vi dịch vụMỗi tác nhân đều có phạm vi dữ liệu và hoạt động riêng. Ngay cả trong cùng một tổ chức, các tác nhân cũng thu thập thông tin chi tiết từ kinh nghiệm sản xuất của riêng họ nhưng hiếm khi chia sẻ kiến thức mà họ tạo ra với các tác nhân khác đưa ra các quyết định liên quan.
Kết quả là, hiểu biết về hoạt động vẫn còn rời rạc. Các quyết định cục bộ có thể được cải thiện, nhưng kinh nghiệm không được tích lũy trên toàn hệ thống. Mỗi bước đột phá chỉ nằm trong phạm vi của một tác nhân duy nhất là một bước đột phá không thể nhân rộng.
Lần này, yếu tố hạn chế không phải là trí thông minh hay tốc độ. Mà là bộ nhớ. Nếu không có cách nào để các hệ thống AI lưu trữ và chia sẻ những gì chúng khám phá được, tiến bộ sẽ bị thiết lập lại thường xuyên hơn là được xây dựng.
Bộ nhớ chia sẻ thực sự trông như thế nào?
Các cửa sổ ngữ cảnh lớn hơn có thể làm phong phú thêm khả năng suy luận cá nhân, nhưng chúng không tạo ra sự chia sẻ. trải nghiệm nhất quán trên các tác nhân.
Bộ nhớ dùng chung thay đổi kết quả không phải bằng cách cải thiện mô hình, mà bằng cách thay đổi những gì các tác nhân có thể nhìn thấy tại thời điểm ra quyết định.
Trong một hệ thống phân mảnh, mỗi tác nhân suy luận chính xác trong phạm vi riêng của mình. Tác nhân thanh toán đánh giá rủi ro giao dịch. Tác nhân hành vi phân tích các mẫu luồng nhấp chuột. Mỗi tác nhân ghi kết luận của mình vào hệ thống mà nó sở hữu, và những kết luận đó vẫn không hiển thị đối với các tác nhân khác hoạt động song song. Các quyết định là chính xác cục bộ, nhưng không đầy đủ trên phạm vi toàn cục.
Với lớp bộ nhớ dùng chung, ranh giới đó biến mất.
Khi tác nhân hành vi xử lý một phiên, nó sẽ thu được một tín hiệu yếu nhưng có ý nghĩa: một mô hình điều hướng liên quan đến các nỗ lực chiếm đoạt tài khoản ban đầu. Thay vì chỉ lưu trữ thông tin đó để phân tích ngoại tuyến, nó ghi tín hiệu vào bộ nhớ dùng chung, được liên kết với phiên hoạt động.
Vài phút sau, khi nhân viên thu ngân đánh giá giao dịch mua hàng, họ truy vấn lại thông tin đó. Giao dịch vẫn có vẻ bình thường. Nhưng giờ đây họ thấy thêm ngữ cảnh: một cảnh báo về hành vi mà lẽ ra sẽ không xuất hiện. Cả hai tín hiệu đều không đủ sức quyết định nếu đứng riêng lẻ. Khi kết hợp lại, chúng vượt qua ngưỡng để tiến hành xác minh thêm.
Không có gì về bản thân các tác nhân (agent) thay đổi. Không có mô hình nào được huấn luyện lại. Không có bộ điều khiển tập trung nào can thiệp. Sự khác biệt nằm ở khả năng hiển thị: một hiểu biết được hình thành bởi một tác nhân sẽ được truyền đạt đến một tác nhân khác trong khi nó vẫn còn quan trọng.
Điều quan trọng là, sự hiểu biết đó vẫn tồn tại. Khi kết quả được biết sau đó—gian lận hay hợp pháp—mối liên hệ giữa tín hiệu và kết quả sẽ được ghi lại. Theo thời gian, hệ thống tích lũy được một hồ sơ thực nghiệm về những chỉ báo yếu nào có xu hướng quan trọng và trong điều kiện nào. Các quyết định trong tương lai được định hướng bởi kinh nghiệm vượt ra ngoài bất kỳ tương tác hoặc tác nhân đơn lẻ nào.
Bộ nhớ dùng chung không phải là kho dữ liệu và cũng không phải là cơ sở dữ liệu hoạt động. Nó là một nền tảng có độ trễ thấp cho ngữ cảnh được suy ra: các tín hiệu, diễn giải và liên kết tồn tại sau tương tác tạo ra chúng và vẫn có thể được truy vấn bởi các tác nhân khác đưa ra các quyết định liên quan.
Đây là cách kinh nghiệm được tích lũy – không phải bên trong bất kỳ mô hình nào riêng lẻ, mà là trên toàn bộ hệ thống.
Sự đánh đổi về kiến trúc đằng sau các hệ thống phân tách nhân viên
Việc phân tách các tác nhân thành các nhóm riêng biệt không phải là một lỗi trong quá trình triển khai. Đó là kết quả tất yếu của các kiến trúc doanh nghiệp được thiết kế xoay quanh một loại người dùng khác.
Trong nhiều thập kỷ, các hệ thống sản xuất đã phân tách khối lượng công việc theo chức năng. Các hệ thống vận hành được tối ưu hóa cho các giao dịch nhất quán, độ trễ thấp, trong khi các hệ thống phân tích được tối ưu hóa cho việc tổng hợp quy mô lớn và phát hiện các mẫu lịch sử (OLTP so với OLAPSự phân tách này phản ánh cách thức tiếp nhận thông tin chuyên sâu: kết quả phân tích được tạo ra cho con người chứ không phải máy móc, và do đó được kỳ vọng sẽ đến một cách không đồng bộ và nằm ngoài quy trình ra quyết định quan trọng.
Các tác nhân AI thừa hưởng sự phân chia kiến trúc này, nhưng chúng không phù hợp với nó.
Hậu quả không chỉ đơn thuần là sự chậm trễ trong việc thấu hiểu vấn đề, mà còn là những điểm mù về cấu trúc. Theo thiết kế, những hiểu biết được tạo ra trong các hệ thống phân tích chỉ được phát hiện sau khi các quyết định thực tế đã được đưa ra. Các tín hiệu có thể thay đổi kết quả tồn tại, nhưng không thể được phát hiện tại thời điểm ra quyết định vì chúng nằm trong các hệ thống không được thiết kế để các nhà ra quyết định tự động liên tục truy vấn.
Kiến trúc này không có vấn đề gì. Nó chỉ không phù hợp với yêu cầu của các hệ thống tự động.
Ngành học còn thiếu: Kỹ thuật bối cảnh
Bộ nhớ dùng chung tạo ra một vấn đề mà hầu hết các nhóm chưa sẵn sàng giải quyết: quyết định xem trải nghiệm nào nên được lưu giữ.
Các hệ thống AI tạo ra một lượng lớn dữ liệu thô – giao dịch, lượt nhấp chuột, tin nhắn, hành động, kết quả. Việc lưu trữ tất cả dữ liệu đó vừa không thực tế vừa không hữu ích. Nếu không được chọn lọc kỹ lưỡng, bộ nhớ chung sẽ trở thành nhiễu. Thách thức không phải là thu thập thêm dữ liệu, mà là định hình kinh nghiệm thành ngữ cảnh mà các tác nhân khác có thể sử dụng.
Đây là vai trò của kỹ thuật ngữ cảnh.
Kỹ thuật ngữ cảnh là lĩnh vực quyết định những quan sát nào trở thành tín hiệu bền vững, cách thức biểu diễn các tín hiệu đó và khi nào chúng nên được truyền đạt đến các tác nhân khác. Nó nằm giữa các sự kiện thô và quá trình suy luận của tác nhân, chuyển đổi hoạt động nhất thời thành sự hiểu biết chung, có liên quan đến quyết định.
Trên thực tế, điều này có nghĩa là ưu tiên các mô hình, chỉ báo và mối liên hệ có điều kiện, đồng thời cho phép phần lớn kinh nghiệm thô mờ dần. Một tín hiệu yếu hoặc trường hợp ngoại lệ có thể không quan trọng khi đứng riêng lẻ, nhưng sẽ trở nên có giá trị khi được tích lũy và làm nổi bật vào đúng thời điểm.
Kỹ thuật ngữ cảnh quyết định liệu bộ nhớ chia sẻ chỉ đơn thuần lưu trữ kinh nghiệm hay cho phép kinh nghiệm được tích lũy.
Điều gì sẽ xảy ra nếu chúng ta làm đúng?
Đây không phải là vấn đề của tương lai. Đây là một quyết định về kiến trúc đang được các nhóm phụ trách cơ sở hạ tầng đưa ra – thường là một cách ngầm định – ngay hôm nay.
Con đường mặc định là sự cô lập. Các tác nhân AI hoạt động độc lập, chỉ dựa vào kinh nghiệm của riêng mình. Mỗi tác nhân đưa ra quyết định nhanh chóng và chính xác cục bộ, nhưng trí thông minh sẽ đạt đến trạng thái bão hòa. Các trường hợp ngoại lệ tương tự lặp đi lặp lại, các tín hiệu yếu được phát hiện lại và các lỗi lặp lại với tốc độ và quy mô lớn hơn.
Một giải pháp thay thế là lớp bộ nhớ dùng chung.
Khi bối cảnh được suy luận vẫn tồn tại và hiển thị rõ ràng tại thời điểm ra quyết định, kinh nghiệm sẽ không bị mai một. Những hiểu biết được phát hiện một lần sẽ vẫn còn khả dụng. Các tín hiệu yếu sẽ có ý nghĩa hơn thông qua quá trình tích lũy. Các quyết định được cải thiện không phải vì mô hình thay đổi, mà vì các tác nhân không còn suy luận một cách độc lập nữa.
Điều này không đòi hỏi các mô hình lớn hơn, huấn luyện lại theo thời gian thực hoặc điều khiển tập trung. Nó đòi hỏi phải coi bộ nhớ như một lớp kiến trúc hạng nhất—được thiết kế để truy cập độ trễ thấp, tính bền vững và khả năng hiển thị chung.
Các thiết lập mặc định của kiến trúc hệ thống nhanh chóng trở nên cứng nhắc. Các hệ thống được xây dựng mà không có bộ nhớ chia sẻ ngày càng khó nâng cấp khi số lượng tác nhân tăng lên. Sự lựa chọn rất đơn giản: xây dựng các hệ thống tích lũy kinh nghiệm—hoặc các hệ thống liên tục thiết lập lại.












