sơ khai AIOS: Hệ điều hành dành cho Đại lý LLM - Unite.AI
Kết nối với chúng tôi

Trí tuệ nhân tạo

AIOS: Hệ điều hành dành cho Đại lý LLM

mm

Được phát hành

 on

AIOS: Hệ điều hành dành cho Đại lý LLM

Trong sáu thập kỷ qua, các hệ điều hành đã phát triển dần dần, từ các hệ thống cơ bản đến các hệ điều hành phức tạp và tương tác cung cấp năng lượng cho các thiết bị ngày nay. Ban đầu, hệ điều hành đóng vai trò là cầu nối giữa chức năng nhị phân của phần cứng máy tính, chẳng hạn như thao tác cổng và các tác vụ ở cấp độ người dùng. Tuy nhiên, qua nhiều năm, họ đã phát triển từ các hệ thống xử lý công việc hàng loạt đơn giản đến các kỹ thuật quản lý quy trình phức tạp hơn, bao gồm đa nhiệm và chia sẻ thời gian. Những tiến bộ này đã cho phép các hệ điều hành hiện đại quản lý một loạt các tác vụ phức tạp. Sự ra đời của giao diện đồ họa người dùng (GUI) như Windows và MacOS đã làm cho các hệ điều hành hiện đại trở nên thân thiện và tương tác hơn với người dùng, đồng thời mở rộng hệ sinh thái HĐH với các thư viện thời gian chạy và bộ công cụ dành cho nhà phát triển toàn diện.

Những đổi mới gần đây bao gồm việc tích hợp và triển khai Mô hình ngôn ngữ lớn (LLM), đã cách mạng hóa các ngành công nghiệp khác nhau bằng cách mở ra những khả năng mới. Gần đây hơn, các tác nhân thông minh dựa trên LLM đã thể hiện những khả năng vượt trội, đạt được hiệu suất giống như con người trong nhiều nhiệm vụ. Tuy nhiên, các tác nhân này vẫn đang trong giai đoạn phát triển ban đầu và các kỹ thuật hiện tại phải đối mặt với một số thách thức ảnh hưởng đến hiệu suất và hiệu quả của chúng. Các vấn đề phổ biến bao gồm việc lập kế hoạch dưới mức tối ưu cho các yêu cầu của tổng đài viên trên mô hình ngôn ngữ lớn, sự phức tạp trong việc tích hợp các tổng đài viên với các chuyên môn khác nhau và duy trì bối cảnh trong quá trình tương tác giữa LLM và tổng đài viên. Sự phát triển nhanh chóng và độ phức tạp ngày càng tăng của các tác nhân dựa trên LLM thường dẫn đến tắc nghẽn và sử dụng tài nguyên dưới mức tối ưu.

Để giải quyết những thách thức này, bài viết này sẽ thảo luận về AIOS, một hệ điều hành tác nhân LLM được thiết kế để tích hợp các mô hình ngôn ngữ lớn làm “bộ não” của hệ điều hành, mang lại cho nó một “linh hồn” một cách hiệu quả. Cụ thể, khung AIOS nhằm mục đích tạo điều kiện thuận lợi cho việc chuyển đổi ngữ cảnh giữa các tác nhân, tối ưu hóa việc phân bổ tài nguyên, cung cấp dịch vụ công cụ cho các tác nhân, duy trì kiểm soát truy cập và cho phép thực thi đồng thời các tác nhân. Chúng ta sẽ đi sâu vào khung AIOS, khám phá các cơ chế, phương pháp và kiến ​​trúc của nó, đồng thời so sánh nó với các khung hiện đại nhất. Hãy đi sâu vào.

Sau khi đạt được thành công đáng kể trong các mô hình ngôn ngữ lớn, trọng tâm tiếp theo của ngành AI và ML là phát triển các tác nhân AI tự trị có thể hoạt động độc lập, tự đưa ra quyết định và thực hiện các nhiệm vụ với sự can thiệp tối thiểu hoặc không có sự can thiệp của con người. Các tác nhân thông minh dựa trên AI này được thiết kế để hiểu hướng dẫn của con người, xử lý thông tin, đưa ra quyết định và thực hiện các hành động thích hợp để đạt được trạng thái tự chủ, với sự ra đời và phát triển của các mô hình ngôn ngữ lớn mang lại những khả năng mới cho sự phát triển của các tác nhân tự trị này. Các khung LLM hiện tại bao gồm DALL-E, GPT, v.v. đã cho thấy khả năng vượt trội trong việc hiểu hướng dẫn của con người, khả năng lý luận và giải quyết vấn đề cũng như tương tác với người dùng con người cùng với môi trường bên ngoài. Được xây dựng dựa trên các mô hình ngôn ngữ lớn mạnh mẽ và có khả năng này, các tác nhân dựa trên LLM có khả năng hoàn thành nhiệm vụ mạnh mẽ trong nhiều môi trường khác nhau, từ trợ lý ảo đến các hệ thống phức tạp và phức tạp hơn liên quan đến việc tạo ra giải pháp giải quyết vấn đề, lý luận, lập kế hoạch và thực thi. 

Hình trên đưa ra một ví dụ thuyết phục về cách một tác nhân tự trị dựa trên LLM có thể giải quyết các nhiệm vụ trong thế giới thực. Người dùng yêu cầu hệ thống cung cấp thông tin chuyến đi, sau đó đại lý du lịch sẽ chia nhiệm vụ thành các bước thực thi. Sau đó, đại lý thực hiện các bước một cách tuần tự, đặt chuyến bay, đặt phòng khách sạn, xử lý thanh toán, v.v. Trong khi thực hiện các bước, điều khiến các tác nhân này khác biệt với các ứng dụng phần mềm truyền thống là khả năng của các tác nhân thể hiện khả năng ra quyết định và kết hợp lý luận trong việc thực hiện các bước. Cùng với sự tăng trưởng theo cấp số nhân về chất lượng của những đại lý tự trị, sự căng thẳng về chức năng của các mô hình ngôn ngữ lớn và hệ điều hành đã chứng kiến ​​​​sự gia tăng và một ví dụ tương tự là việc ưu tiên và lập lịch các yêu cầu tác nhân trong các mô hình ngôn ngữ lớn có giới hạn đặt ra một thách thức đáng kể. Hơn nữa, do quá trình tạo các mô hình ngôn ngữ lớn trở thành một công việc tốn thời gian khi xử lý các ngữ cảnh dài, nên bộ lập lịch có thể tạm dừng việc tạo kết quả, gây ra vấn đề đưa ra cơ chế chụp nhanh kết quả tạo hiện tại của mô hình ngôn ngữ. . Do đó, hành vi tạm dừng/tiếp tục được bật khi mô hình ngôn ngữ lớn chưa hoàn tất việc tạo phản hồi cho yêu cầu hiện tại. 

Để giải quyết những thách thức nêu trên, AIOS, một hệ điều hành mô hình ngôn ngữ lớn cung cấp các tập hợp và tách biệt mô-đun của các chức năng LLM và OS. Khung AIOS đề xuất thiết kế hạt nhân dành riêng cho LLM nhằm tránh xung đột tiềm ẩn phát sinh giữa các tác vụ được liên kết và không liên quan đến mô hình ngôn ngữ lớn. Hạt nhân được đề xuất tách biệt các nhiệm vụ giống như hệ điều hành, đặc biệt là các nhiệm vụ giám sát các tác nhân LLM, bộ công cụ phát triển và các tài nguyên tương ứng của chúng. Do sự tách biệt này, hạt nhân LLM cố gắng tăng cường sự phối hợp và quản lý các hoạt động liên quan đến LLM. 

AIOS: Phương pháp luận và kiến ​​trúc

Như bạn có thể quan sát, có sáu cơ chế chính liên quan đến hoạt động của khung AIOS. 

  • Người lập lịch đại lý: Nhiệm vụ được giao cho bộ lập lịch tác nhân là lên lịch và ưu tiên các yêu cầu của tác nhân nhằm cố gắng tối ưu hóa việc sử dụng mô hình ngôn ngữ lớn. 
  • Trình quản lý ngữ cảnh: Nhiệm vụ được giao cho trình quản lý ngữ cảnh là hỗ trợ ảnh chụp nhanh cùng với việc khôi phục trạng thái tạo trung gian trong mô hình ngôn ngữ lớn và quản lý cửa sổ ngữ cảnh của mô hình ngôn ngữ lớn. 
  • Trình quản lý bộ nhớ: Trách nhiệm chính của người quản lý bộ nhớ là cung cấp bộ nhớ ngắn hạn cho nhật ký tương tác cho từng tác nhân. 
  • Storage Manager: Người quản lý lưu trữ có trách nhiệm lưu giữ nhật ký tương tác của các tác nhân vào bộ lưu trữ dài hạn để truy xuất trong tương lai. 
  • Trình quản lý công cụ: Cơ chế quản lý công cụ quản lý việc gọi các tác nhân tới các công cụ API bên ngoài. 
  • Trình quản lý quyền truy cập: Trình quản lý truy cập thực thi các chính sách kiểm soát quyền riêng tư và quyền truy cập giữa các tác nhân. 

Ngoài các cơ chế được đề cập ở trên, khung AIOS còn có kiến ​​trúc phân lớp và được chia thành ba lớp riêng biệt: lớp ứng dụng, lớp nhân và lớp phần cứng. Kiến trúc phân lớp được khung AIOS triển khai đảm bảo các trách nhiệm được phân bổ đồng đều trên toàn hệ thống và các lớp cao hơn trừu tượng hóa sự phức tạp của các lớp bên dưới chúng, cho phép tương tác bằng cách sử dụng các mô-đun hoặc giao diện cụ thể, nâng cao tính mô-đun và đơn giản hóa các tương tác hệ thống giữa các mô-đun hoặc giao diện cụ thể. các lớp. 

Bắt đầu với lớp ứng dụng, lớp này được sử dụng để phát triển và triển khai các tác nhân ứng dụng như toán học hoặc tác nhân du lịch. Trong lớp ứng dụng, khung AIOS cung cấp bộ công cụ phát triển phần mềm AIOS (AIOS SDK) với mức độ trừu tượng hóa cao hơn của các lệnh gọi hệ thống giúp đơn giản hóa quy trình phát triển cho các nhà phát triển tác nhân. Bộ công cụ phát triển phần mềm do AIOS cung cấp cung cấp một bộ công cụ phong phú để hỗ trợ phát triển các ứng dụng tác nhân bằng cách loại bỏ sự phức tạp của các chức năng hệ thống cấp thấp hơn, cho phép các nhà phát triển tập trung vào các chức năng và logic thiết yếu của các tác nhân của họ, mang lại sự phát triển hiệu quả hơn quá trình. 

Tiếp tục, lớp kernel được chia thành hai thành phần: kernel LLM và kernel OS. Cả nhân hệ điều hành và nhân LLM đều phục vụ các yêu cầu riêng của các hoạt động dành riêng cho LLM và không phải LLM, với sự khác biệt cho phép nhân LLM tập trung vào các tác vụ cụ thể của mô hình ngôn ngữ lớn bao gồm lập lịch tác nhân và quản lý ngữ cảnh, các hoạt động cần thiết để xử lý các hoạt động liên quan đến các mô hình ngôn ngữ lớn. Khung AIOS tập trung chủ yếu vào việc nâng cao hạt nhân mô hình ngôn ngữ lớn mà không thay đổi đáng kể cấu trúc của hạt nhân hệ điều hành hiện có. Nhân LLM được trang bị một số mô-đun chính bao gồm bộ lập lịch tác nhân, trình quản lý bộ nhớ, trình quản lý bối cảnh, trình quản lý lưu trữ, trình quản lý truy cập, trình quản lý công cụ và giao diện cuộc gọi hệ thống LLM. Các thành phần trong lớp kernel được thiết kế nhằm cố gắng giải quyết các nhu cầu thực thi đa dạng của các ứng dụng tác nhân, đảm bảo thực thi và quản lý hiệu quả trong khuôn khổ AIOS. 

Cuối cùng, chúng ta có lớp phần cứng bao gồm các thành phần vật lý của hệ thống bao gồm GPU, CPU, thiết bị ngoại vi, đĩa và bộ nhớ. Điều cần thiết là phải hiểu rằng hệ thống của hạt nhân LLM không thể tương tác trực tiếp với phần cứng và các lệnh gọi này giao tiếp với các lệnh gọi hệ thống của hệ điều hành để quản lý tài nguyên phần cứng. Sự tương tác gián tiếp giữa hệ thống của LLM karnel và tài nguyên phần cứng tạo ra một lớp bảo mật và trừu tượng, cho phép hạt nhân LLM tận dụng khả năng của tài nguyên phần cứng mà không yêu cầu quản lý phần cứng trực tiếp, tạo điều kiện duy trì tính toàn vẹn và hiệu quả của hệ thống . 

Thực hiện

Như đã đề cập ở trên, có sáu cơ chế chính liên quan đến hoạt động của khung AIOS. Bộ lập lịch tác nhân được thiết kế theo cách có thể quản lý các yêu cầu tác nhân một cách hiệu quả và có một số bước thực hiện trái với mô hình thực thi tuần tự truyền thống trong đó tác nhân xử lý các tác vụ theo cách tuyến tính với các bước giống nhau. tác nhân được xử lý trước khi chuyển sang tác nhân tiếp theo, dẫn đến tăng thời gian chờ đợi cho các tác vụ xuất hiện sau trong chuỗi thực thi. Bộ lập lịch tác nhân sử dụng các chiến lược như Round Robin, First In First Out và các thuật toán lập lịch khác để tối ưu hóa quy trình. 

Trình quản lý bối cảnh đã được thiết kế theo cách chịu trách nhiệm quản lý bối cảnh được cung cấp cho mô hình ngôn ngữ lớn và quá trình tạo trong bối cảnh nhất định. Trình quản lý bối cảnh bao gồm hai thành phần quan trọng: chụp nhanh và khôi phục bối cảnh và quản lý cửa sổ ngữ cảnh. Cơ chế khôi phục và chụp nhanh bối cảnh do khung AIOS cung cấp giúp giảm thiểu các tình huống trong đó bộ lập lịch tạm dừng các yêu cầu của tác nhân như minh họa trong hình dưới đây. 

Như được minh họa trong hình dưới đây, người quản lý bộ nhớ có trách nhiệm quản lý bộ nhớ ngắn hạn trong vòng đời của tác nhân và đảm bảo dữ liệu được lưu trữ và chỉ có thể truy cập được khi tác nhân đang hoạt động, trong thời gian chạy hoặc khi tác nhân đang chờ để thi hành. 

Mặt khác, người quản lý lưu trữ chịu trách nhiệm bảo quản dữ liệu trong thời gian dài và giám sát việc lưu trữ thông tin cần được lưu giữ trong một khoảng thời gian không xác định, vượt quá tuổi thọ hoạt động của một tác nhân riêng lẻ. Khung AISO đạt được khả năng lưu trữ vĩnh viễn bằng nhiều phương tiện bền bỉ bao gồm các giải pháp dựa trên đám mây, cơ sở dữ liệu và tệp cục bộ, đảm bảo tính khả dụng và tính toàn vẹn của dữ liệu. Hơn nữa, trong khung AISO, trình quản lý công cụ sẽ quản lý một loạt các công cụ API khác nhau nhằm nâng cao chức năng của các mô hình ngôn ngữ lớn và bảng sau đây tóm tắt cách trình quản lý công cụ tích hợp các công cụ thường được sử dụng từ nhiều tài nguyên khác nhau và phân loại chúng thành các loại khác nhau. 

Người quản lý truy cập tổ chức các hoạt động kiểm soát truy cập trong phạm vi riêng biệt đại lý bằng cách quản lý một nhóm đặc quyền dành riêng cho mỗi tác nhân và từ chối quyền truy cập của một tác nhân vào tài nguyên của nó nếu chúng bị loại khỏi nhóm đặc quyền của tác nhân. Ngoài ra, người quản lý truy cập cũng chịu trách nhiệm biên soạn và duy trì nhật ký kiểm tra nhằm nâng cao hơn nữa tính minh bạch của hệ thống. 

AIOS: Thử nghiệm và kết quả

Việc đánh giá khung AIOS được hướng dẫn bởi hai câu hỏi nghiên cứu: thứ nhất, hiệu suất của việc lập kế hoạch AIOS trong việc cải thiện thời gian chờ và quay vòng số dư như thế nào và thứ hai, liệu phản hồi của LLM đối với các yêu cầu của đại lý có nhất quán sau khi tạm dừng đại lý hay không?

Để trả lời các câu hỏi về tính nhất quán, các nhà phát triển chạy từng tác nhân trong số ba tác nhân riêng lẻ, sau đó thực thi các tác nhân này song song và cố gắng nắm bắt kết quả đầu ra của chúng trong mỗi giai đoạn. Như được minh họa trong bảng sau, điểm BERT và BLEU đạt giá trị 1.0, cho thấy sự liên kết hoàn hảo giữa các đầu ra được tạo trong cấu hình một tác nhân và nhiều tác nhân. 

Để trả lời các câu hỏi về hiệu quả, các nhà phát triển tiến hành phân tích so sánh giữa khung AIOS sử dụng lập lịch FIFO hoặc First In First Out và cách tiếp cận không theo lịch trình, trong đó các tác nhân chạy đồng thời. Trong cài đặt không được lên lịch, các tác nhân được thực thi theo thứ tự tuần tự được xác định trước: tác nhân toán học, tác nhân tường thuật và tác nhân rec. Để đánh giá hiệu quả về thời gian, khung AIOS sử dụng hai số liệu: thời gian chờ đợi và thời gian phản hồi và do các tác nhân gửi nhiều yêu cầu đến mô hình ngôn ngữ lớn nên thời gian chờ đợi và thời gian phản hồi cho từng tác nhân được tính bằng mức trung bình của thời gian chờ đợi và thời gian đáp ứng mọi yêu cầu. Như được trình bày trong bảng sau, cách tiếp cận không theo lịch trình sẽ hiển thị hiệu suất thỏa đáng cho các tổng đài viên sớm hơn trong trình tự, nhưng lại phải chịu thời gian chờ đợi và quay vòng kéo dài đối với các tổng đài viên ở giai đoạn sau trong trình tự. Mặt khác, cách tiếp cận lập kế hoạch do khung AIOS triển khai sẽ điều chỉnh cả thời gian chờ đợi và thời gian quay vòng một cách hiệu quả. 

Kết luận:

Trong bài viết này, chúng ta đã nói về AIOS, một hệ điều hành tác nhân LLM được thiết kế nhằm nỗ lực nhúng các mô hình ngôn ngữ lớn vào HĐH làm bộ não của HĐH, tạo nên một hệ điều hành có linh hồn. Cụ thể hơn, khung AIOS được thiết kế với mục đích tạo điều kiện thuận lợi cho việc chuyển đổi ngữ cảnh giữa các tác nhân, tối ưu hóa việc phân bổ tài nguyên, cung cấp dịch vụ công cụ cho các tác nhân, duy trì kiểm soát truy cập cho các tác nhân và cho phép thực thi đồng thời các tác nhân. Kiến trúc AISO thể hiện tiềm năng tạo thuận lợi cho việc phát triển và triển khai Các tác nhân tự trị dựa trên mô hình ngôn ngữ lớn, tạo ra một hệ sinh thái AIOS-Agent hiệu quả, gắn kết và hiệu quả hơn. 

"Kỹ sư chuyên nghiệp, nhà văn có tâm". Kunal là một nhà văn kỹ thuật có niềm yêu thích và hiểu biết sâu sắc về AI và ML, chuyên đơn giản hóa các khái niệm phức tạp trong các lĩnh vực này thông qua tài liệu hấp dẫn và nhiều thông tin của mình.