ხელოვნური ინტელექტი

AIOS: ოპერაციული სისტემა LLM აგენტებისთვის

გამოქვეყნებულია

2 კვირის წინ

აპრილი 25, 2024

AIOS: ოპერაციული სისტემა LLM აგენტებისთვის

ბოლო ექვსი ათწლეულის განმავლობაში, ოპერაციული სისტემები პროგრესულად განვითარდა, ძირითადი სისტემებიდან გადაიზარდა რთულ და ინტერაქტიულ ოპერაციულ სისტემებამდე, რომლებიც კვებავს დღევანდელ მოწყობილობებს. თავდაპირველად, ოპერაციული სისტემები ასრულებდა ხიდს კომპიუტერული ტექნიკის ორობით ფუნქციონალურობას შორის, როგორიცაა კარიბჭის მანიპულირება და მომხმარებლის დონის ამოცანები. თუმცა, წლების განმავლობაში, მათ განავითარეს სამუშაოების დამუშავების მარტივი სისტემებიდან პროცესის მართვის უფრო დახვეწილ ტექნიკამდე, მათ შორის მრავალ დავალების შესრულებას და დროის გაზიარებას. ამ მიღწევებმა თანამედროვე ოპერაციულ სისტემებს საშუალება მისცა მართონ რთული ამოცანების ფართო სპექტრი. მომხმარებლის გრაფიკული ინტერფეისების (GUI) დანერგვამ, როგორიცაა Windows და MacOS, გახადა თანამედროვე ოპერაციული სისტემები უფრო მოსახერხებელი და ინტერაქტიული, ამასთან, გააფართოვა OS ეკოსისტემა Runtime ბიბლიოთეკებით და დეველოპერების ინსტრუმენტების ყოვლისმომცველი კომპლექტით.

ბოლო ინოვაციები მოიცავს ინტეგრაციას და განლაგებას დიდი ენის მოდელები (LLMs), რომლებმაც მოახდინეს რევოლუცია სხვადასხვა ინდუსტრიაში ახალი შესაძლებლობების გახსნით. ახლახან, LLM-ზე დაფუძნებულმა ინტელექტუალურმა აგენტებმა აჩვენეს შესანიშნავი შესაძლებლობები, მიაღწიეს ადამიანის მსგავს შესრულებას ამოცანების ფართო სპექტრში. თუმცა, ეს აგენტები ჯერ კიდევ განვითარების ადრეულ ეტაპებზეა და მიმდინარე ტექნიკას აწყდება რამდენიმე გამოწვევა, რაც გავლენას ახდენს მათ ეფექტურობაზე და ეფექტურობაზე. საერთო საკითხები მოიცავს აგენტების მოთხოვნების არაოპტიმალურ განრიგს დიდი ენის მოდელზე, სხვადასხვა სპეციალიზაციით აგენტების ინტეგრირების სირთულეებს და LLM-სა და აგენტს შორის ურთიერთქმედების დროს კონტექსტის შენარჩუნებას. LLM-ზე დაფუძნებული აგენტების სწრაფი განვითარება და მზარდი სირთულე ხშირად იწვევს შეფერხებებს და რესურსების არაოპტიმალურ გამოყენებას.

ამ გამოწვევების გადასაჭრელად, ეს სტატია განიხილავს AIOS-ს, LLM აგენტის ოპერაციულ სისტემას, რომელიც შექმნილია დიდი ენობრივი მოდელების ინტეგრირებისთვის, როგორც ოპერაციული სისტემის „ტვინი“, რაც ეფექტურად აძლევს მას „სულს“. კერძოდ, AIOS ჩარჩო მიზნად ისახავს აგენტებს შორის კონტექსტის გადართვას, რესურსების განაწილების ოპტიმიზაციას, აგენტებისთვის ხელსაწყოების სერვისების უზრუნველყოფას, წვდომის კონტროლის შენარჩუნებას და აგენტების ერთდროულად შესრულების ჩართვას. ჩვენ ღრმად ჩავუღრმავდებით AIOS ჩარჩოს, შევისწავლით მის მექანიზმებს, მეთოდოლოგიას და არქიტექტურას და შევადარებთ მას თანამედროვე ჩარჩოებს. მოდი ჩავყვინთოთ.

დიდ ენობრივ მოდელებში შესანიშნავი წარმატების მიღწევის შემდეგ, AI და ML ინდუსტრიის შემდეგი აქცენტი არის ავტონომიური AI აგენტების განვითარება, რომლებსაც შეუძლიათ დამოუკიდებლად იმუშაონ, მიიღონ გადაწყვეტილებები და შეასრულონ დავალებები ადამიანის მინიმალური ჩარევით ან გარეშე. ეს AI-ზე დაფუძნებული ინტელექტუალური აგენტები შექმნილია ადამიანის ინსტრუქციების გასაგებად, ინფორმაციის დასამუშავებლად, გადაწყვეტილებების მისაღებად და შესაბამისი მოქმედებების გასატარებლად ავტონომიური მდგომარეობის მისაღწევად. ამჟამინდელი LLM ჩარჩოები, მათ შორის DALL-E, GPT და სხვა, აჩვენეს შესანიშნავი შესაძლებლობები ადამიანის ინსტრუქციების გაგების, მსჯელობისა და პრობლემების გადაჭრის უნარების და ადამიანებთან ურთიერთობის გარე გარემოსთან ერთად. LLM-ზე დაფუძნებულ აგენტებს აქვთ ამოცანების შესრულების ძლიერი შესაძლებლობები, დაწყებული ვირტუალური ასისტენტებით დაწყებული, უფრო რთული და დახვეწილი სისტემებით დამთავრებული, პრობლემების გადაჭრის, მსჯელობის, დაგეგმვისა და შესრულების შექმნით.

ზემოთ მოყვანილი ფიგურა იძლევა დამაჯერებელ მაგალითს, თუ როგორ შეუძლია LLM-ზე დაფუძნებულ ავტონომიურ აგენტს გადაჭრას რეალური ამოცანები. მომხმარებელი ითხოვს სისტემას მოგზაურობის შესახებ ინფორმაციის მისაღებად, რის შემდეგაც ტურისტული აგენტი ანაწილებს დავალებას შესრულებად ეტაპებად. შემდეგ აგენტი ახორციელებს ეტაპებს თანმიმდევრობით, ფრენების დაჯავშნა, სასტუმროების დაჯავშნა, გადახდების დამუშავება და სხვა. ნაბიჯების შესრულებისას ის, რაც ამ აგენტებს გამოარჩევს ტრადიციული პროგრამული აპლიკაციებისგან, არის აგენტების უნარი, აჩვენონ გადაწყვეტილების მიღების შესაძლებლობები და ჩართონ მსჯელობა ნაბიჯების შესრულებაში. მათი ხარისხის ექსპონენციალურ ზრდასთან ერთად ავტონომიური აგენტები, დიდი ენობრივი მოდელების და ოპერაციული სისტემების ფუნქციონალობაზე დაძაბულობა გაიზარდა, და ამის მაგალითია ის, რომ პრიორიტეტული და დაგეგმილი აგენტების მოთხოვნები შეზღუდული დიდი ენის მოდელებში წარმოადგენს მნიშვნელოვან გამოწვევას. გარდა ამისა, იმის გამო, რომ დიდი ენობრივი მოდელების გენერირების პროცესი ხდება შრომატევადი ამოცანა, როდესაც საქმე ეხება გრძელ კონტექსტს, შესაძლებელია განლაგმა შეაჩეროს შედეგად წარმოქმნილი თაობა, რაც აჩენს მექანიზმის შემუშავების პრობლემას ენის მოდელის მიმდინარე თაობის შედეგის გადასაღებად. . ამის შედეგად, პაუზის/განახლების ქცევა ჩართულია, როდესაც დიდი ენის მოდელმა არ დაასრულა პასუხის გენერაცია მიმდინარე მოთხოვნისთვის.

ზემოთ აღნიშნული გამოწვევების გადასაჭრელად, AIOS, დიდი ენობრივი მოდელის ოპერაციული სისტემა უზრუნველყოფს LLM და OS ფუნქციების აგრეგაციას და მოდულის იზოლაციას. AIOS ჩარჩო გვთავაზობს LLM-ს სპეციფიკურ ბირთვის დიზაინს, რათა თავიდან იქნას აცილებული პოტენციური კონფლიქტები, რომლებიც დაკავშირებულია და არ არის დაკავშირებული დიდ ენობრივ მოდელთან. შემოთავაზებული ბირთვი ანაწილებს ოპერაციულ სისტემას, როგორც მოვალეობებს, განსაკუთრებით მათ, ვინც ზედამხედველობს LLM აგენტებს, განვითარების ინსტრუმენტთა კომპლექტს და მათ შესაბამის რესურსებს. ამ სეგრეგაციის შედეგად, LLM ბირთვი ცდილობს გააძლიეროს LLM-ებთან დაკავშირებული აქტივობების კოორდინაცია და მართვა.

AIOS: მეთოდოლოგია და არქიტექტურა

როგორც ხედავთ, ექვსი ძირითადი მექანიზმია ჩართული AIOS ჩარჩოს მუშაობაში.

აგენტის განრიგი: აგენტის დამგეგმავისთვის დაკისრებული ამოცანაა აგენტის მოთხოვნების დაგეგმვა და პრიორიტეტიზაცია დიდი ენის მოდელის გამოყენების ოპტიმიზაციის მცდელობაში.

კონტექსტის მენეჯერი: კონტექსტის მენეჯერისთვის დაკისრებული ამოცანაა სნეპშოტების მხარდაჭერა დიდი ენობრივი მოდელის შუალედური თაობის სტატუსის აღდგენასთან ერთად და დიდი ენობრივი მოდელის კონტექსტური ფანჯრის მართვა.

მეხსიერების მენეჯერი: მეხსიერების მენეჯერის უპირველესი პასუხისმგებლობაა თითოეული აგენტისთვის ურთიერთქმედების ჟურნალისთვის მოკლევადიანი მეხსიერების უზრუნველყოფა.

შენახვის მენეჯერი: მეხსიერების მენეჯერი პასუხისმგებელია აგენტების ურთიერთქმედების ჟურნალების შენარჩუნებაზე გრძელვადიან შენახვამდე სამომავლო ძიების მიზნით.

ხელსაწყოების მენეჯერი: ხელსაწყოების მენეჯერის მექანიზმი მართავს აგენტების გამოძახებას გარე API ინსტრუმენტებზე.

წვდომის მენეჯერი: წვდომის მენეჯერი ახორციელებს კონფიდენციალურობისა და წვდომის კონტროლის პოლიტიკას აგენტებს შორის.

ზემოაღნიშნული მექანიზმების გარდა, AIOS ჩარჩოს აქვს ფენიანი არქიტექტურა და იყოფა სამ განსხვავებულ ფენად: განაცხადის ფენა, ბირთვის ფენა და აპარატურის ფენა. AIOS ჩარჩოს მიერ დანერგილი ფენიანი არქიტექტურა უზრუნველყოფს პასუხისმგებლობების თანაბრად განაწილებას მთელს სისტემაში და უფრო მაღალი ფენები აბსტრაქტებს მათ ქვემოთ არსებული ფენების სირთულეებს, რაც საშუალებას აძლევს ურთიერთქმედებას კონკრეტული მოდულების ან ინტერფეისების გამოყენებით, აძლიერებს მოდულარობას და ამარტივებს სისტემის ურთიერთქმედებებს შორის. ფენები.

აპლიკაციის ფენით დაწყებული, ეს ფენა გამოიყენება აპლიკაციის აგენტების შემუშავებისა და განსათავსებლად, როგორიცაა მათემატიკა ან ტურისტული აგენტები. აპლიკაციის ფენაში, AIOS ჩარჩო უზრუნველყოფს AIOS პროგრამული უზრუნველყოფის განვითარების კომპლექტს (AIOS SDK) სისტემური ზარების უფრო მაღალ აბსტრაქციას, რაც ამარტივებს განვითარების პროცესს აგენტების დეველოპერებისთვის. AIOS-ის მიერ შემოთავაზებული პროგრამული უზრუნველყოფის განვითარების ნაკრები გვთავაზობს მდიდარ ხელსაწყოების კომპლექტს აგენტური აპლიკაციების შემუშავების გასაადვილებლად ქვედა დონის სისტემის ფუნქციების სირთულის აბსტრაქციის გზით, რაც დეველოპერებს საშუალებას აძლევს ფოკუსირება მოახდინონ თავიანთი აგენტების ფუნქციონალურობაზე და არსებით ლოგიკაზე, რაც გამოიწვევს უფრო ეფექტურ განვითარებას. პროცესი.

შემდგომში, ბირთვის ფენა იყოფა ორ კომპონენტად: LLM ბირთვი და OS ბირთვი. ორივე OS ბირთვი და LLM ბირთვი ემსახურება LLM-სპეციფიკური და არა LLM ოპერაციების უნიკალურ მოთხოვნებს, რაც საშუალებას აძლევს LLM ბირთვს ფოკუსირება მოახდინოს დიდი ენის მოდელის სპეციფიკურ ამოცანებზე, აგენტების დაგეგმვისა და კონტექსტური მენეჯმენტის ჩათვლით, აქტივობები, რომლებიც აუცილებელია აქტივობების მართვისთვის. დიდ ენობრივ მოდელებთან დაკავშირებული. AIOS ჩარჩო ძირითადად კონცენტრირებულია მსხვილი ენობრივი მოდელის ბირთვის გაძლიერებაზე არსებული OS ბირთვის სტრუქტურის მნიშვნელოვანი მონაცვლეობის გარეშე. LLM ბირთვი აღჭურვილია რამდენიმე ძირითადი მოდულით, მათ შორის აგენტის განრიგის, მეხსიერების მენეჯერის, კონტექსტური მენეჯერის, შენახვის მენეჯერის, წვდომის მენეჯერის, ხელსაწყოების მენეჯერის და LLM სისტემის ზარის ინტერფეისის ჩათვლით. კომპონენტები ბირთვის ფენაში შექმნილია იმისთვის, რომ დააკმაყოფილონ შესრულების სხვადასხვა საჭიროებები აგენტური აპლიკაციების, ეფექტური შესრულებისა და მართვის უზრუნველყოფა AIOS ფარგლებში.

და ბოლოს, ჩვენ გვაქვს აპარატურის ფენა, რომელიც მოიცავს სისტემის ფიზიკურ კომპონენტებს, მათ შორის GPU, CPU, პერიფერიული მოწყობილობები, დისკი და მეხსიერება. აუცილებელია გვესმოდეს, რომ LLM ბირთვების სისტემას არ შეუძლია უშუალოდ ურთიერთქმედება აპარატურასთან და ეს ზარები ურთიერთქმედებს ოპერაციული სისტემის სისტემურ ზარებთან, რომლებიც თავის მხრივ მართავენ აპარატურულ რესურსებს. ეს არაპირდაპირი ურთიერთქმედება LLM კარნელის სისტემასა და აპარატურულ რესურსებს შორის ქმნის უსაფრთხოებისა და აბსტრაქციის ფენას, რაც საშუალებას აძლევს LLM ბირთვს გამოიყენოს ტექნიკის რესურსების შესაძლებლობები უშუალოდ ტექნიკის მართვის მოთხოვნის გარეშე, რაც ხელს უწყობს სისტემის მთლიანობისა და ეფექტურობის შენარჩუნებას. .

განხორციელება

როგორც ზემოთ აღვნიშნეთ, AIOS ჩარჩოს მუშაობაში ჩართულია ექვსი ძირითადი მექანიზმი. აგენტის გრაფიკი შექმნილია ისე, რომ მას შეუძლია აგენტის მოთხოვნები ეფექტურად მართოს და აქვს შესრულების რამდენიმე საფეხური, რომელიც ეწინააღმდეგება ტრადიციული თანმიმდევრული შესრულების პარადიგმას, რომელშიც აგენტი ამუშავებს ამოცანებს ხაზოვანი გზით, იგივე ნაბიჯებით. აგენტი პირველად მუშავდება შემდეგ აგენტზე გადასვლამდე, რის შედეგადაც იზრდება ლოდინის დრო დავალებებისთვის, რომლებიც მოგვიანებით გამოჩნდება შესრულების თანმიმდევრობაში. აგენტის დამგეგმავი იყენებს სტრატეგიებს, როგორიცაა Round Robin, First In First Out და სხვა დაგეგმვის ალგორითმები პროცესის ოპტიმიზაციისთვის.

კონტექსტის მენეჯერი შექმნილია ისე, რომ იგი პასუხისმგებელია დიდი ენობრივი მოდელისთვის მიწოდებული კონტექსტის მართვაზე და გარკვეული კონტექსტის გათვალისწინებით გენერირების პროცესზე. კონტექსტის მენეჯერი მოიცავს ორ მნიშვნელოვან კომპონენტს: კონტექსტის სნეფშოტს და აღდგენას და კონტექსტური ფანჯრის მართვას. AIOS ჩარჩოს მიერ შემოთავაზებული კონტექსტური სნეპშოტი და აღდგენის მექანიზმი გვეხმარება სიტუაციების შერბილებაში, როდესაც დამგეგმავი აჩერებს აგენტის მოთხოვნას, როგორც ეს ნაჩვენებია შემდეგ ფიგურაში.

როგორც ნაჩვენებია ქვემოთ მოცემულ სურათზე, მეხსიერების მენეჯერის პასუხისმგებლობაა აგენტის სასიცოცხლო ციკლის ფარგლებში მოკლევადიანი მეხსიერების მართვა და უზრუნველყოფს მონაცემების შენახვას და ხელმისაწვდომობას მხოლოდ მაშინ, როდესაც აგენტი აქტიურია, ან გაშვების დროს ან როცა აგენტი ელოდება. აღსასრულებლად.

მეორეს მხრივ, შენახვის მენეჯერი პასუხისმგებელია მონაცემთა გრძელვადიან პერსპექტივაში შენარჩუნებაზე და ის აკონტროლებს ინფორმაციის შენახვას, რომელიც უნდა იყოს შენახული განუსაზღვრელი ვადით, ინდივიდუალური აგენტის მოქმედების ვადის მიღმა. AISO ჩარჩო აღწევს მუდმივ შენახვას სხვადასხვა გამძლე მედიის გამოყენებით, მათ შორის ღრუბელზე დაფუძნებული გადაწყვეტილებები, მონაცემთა ბაზები და ადგილობრივი ფაილები, რაც უზრუნველყოფს მონაცემთა ხელმისაწვდომობას და მთლიანობას. გარდა ამისა, AISO ჩარჩოში, ეს არის ინსტრუმენტების მენეჯერი, რომელიც მართავს API ინსტრუმენტების სხვადასხვა მასივს, რომელიც აძლიერებს დიდი ენობრივი მოდელების ფუნქციონირებას და შემდეგი ცხრილი აჯამებს, თუ როგორ აერთიანებს ხელსაწყოების მენეჯერი ჩვეულებრივ გამოყენებულ ინსტრუმენტებს სხვადასხვა რესურსებიდან და ახარისხებს მათ. სხვადასხვა კატეგორიებად.

წვდომის მენეჯერი აწყობს წვდომის კონტროლის ოპერაციებს სხვადასხვა ფარგლებში აგენტები თითოეული აგენტისთვის გამოყოფილი პრივილეგიური ჯგუფის ადმინისტრირებით და აგენტს უარს ამბობს მის რესურსებზე წვდომაზე, თუ ისინი გამორიცხულია აგენტის პრივილეგიების ჯგუფიდან. გარდა ამისა, წვდომის მენეჯერი ასევე პასუხისმგებელია აუდიტის ჟურნალების შედგენასა და შენარჩუნებაზე, რაც კიდევ უფრო აძლიერებს სისტემის გამჭვირვალობას.

AIOS: ექსპერიმენტები და შედეგები

AIOS ჩარჩოს შეფასება ხელმძღვანელობს ორი კვლევის კითხვით: პირველი, როგორია AIOS დაგეგმვის მოქმედება ბალანსის მოლოდინისა და შემობრუნების დროის გაუმჯობესებაში, და მეორე, თანმიმდევრულია თუ არა LLM პასუხი აგენტის მოთხოვნაზე აგენტის შეჩერების შემდეგ?

თანმიმდევრულობის კითხვებზე პასუხის გასაცემად, დეველოპერები აწარმოებენ თითოეულს სამი აგენტიდან ინდივიდუალურად და შემდგომში ასრულებენ ამ აგენტებს პარალელურად და ცდილობენ დაიჭირონ მათი შედეგები ყოველი ეტაპის განმავლობაში. როგორც ნაჩვენებია შემდეგ ცხრილში, BERT და BLEU ქულები აღწევს 1.0 მნიშვნელობას, რაც მიუთითებს სრულყოფილ გასწორებაზე ერთ-აგენტიან და მრავალ აგენტურ კონფიგურაციებში გენერირებულ შედეგებს შორის.

ეფექტურობის კითხვებზე პასუხის გასაცემად, დეველოპერები ატარებენ შედარებით ანალიზს AIOS ჩარჩოს შორის, რომელიც იყენებს FIFO-ს ან First In First Out განრიგს და არა დაგეგმილ მიდგომას, სადაც აგენტები მუშაობენ ერთდროულად. არაგეგმურ პარამეტრში, აგენტები სრულდება წინასწარ განსაზღვრული თანმიმდევრობით: მათემატიკის აგენტი, თხრობის აგენტი და rec აგენტი. დროებითი ეფექტურობის შესაფასებლად, AIOS ჩარჩო იყენებს ორ მეტრიკას: ლოდინის დრო და შემობრუნების დრო, და ვინაიდან აგენტები აგზავნიან მრავალ მოთხოვნას დიდი ენის მოდელზე, ინდივიდუალური აგენტებისთვის ლოდინის დრო და შემობრუნების დრო გამოითვლება საშუალოდ. ლოდინის დრო და შემობრუნების დრო ყველა მოთხოვნისთვის. როგორც ნაჩვენებია შემდეგ ცხრილში, არაგეგმიური მიდგომა აჩვენებს დამაკმაყოფილებელ შესრულებას აგენტებისთვის ადრე მიმდევრობაში, მაგრამ განიცდის გახანგრძლივებულ ლოდინს და გადაბრუნების დროს აგენტებისთვის შემდგომი თანმიმდევრობით. მეორეს მხრივ, AIOS ჩარჩოს მიერ განხორციელებული დაგეგმვის მიდგომა ეფექტურად არეგულირებს როგორც ლოდინის, ასევე გადაბრუნების დროს.

საბოლოო ფიქრები

ამ სტატიაში ჩვენ ვისაუბრეთ AIOS-ზე, LLM აგენტის ოპერაციულ სისტემაზე, რომელიც შექმნილია OS-ში დიდი ენობრივი მოდელების ჩასართავად, როგორც OS-ის ტვინში, რაც საშუალებას აძლევს ოპერაციულ სისტემას სულით. უფრო კონკრეტულად რომ ვთქვათ, AIOS ჩარჩო შექმნილია იმ მიზნით, რომ ხელი შეუწყოს აგენტებს შორის კონტექსტის გადართვას, რესურსების განაწილების ოპტიმიზაციას, აგენტებისთვის ხელსაწყოების სერვისის უზრუნველყოფას, აგენტებისთვის წვდომის კონტროლის შენარჩუნებას და აგენტების ერთდროულად შესრულების ჩართვას. AISO არქიტექტურა აჩვენებს პოტენციალს, ხელი შეუწყოს განვითარებისა და განლაგებას დიდი ენის მოდელზე დაფუძნებული ავტონომიური აგენტები, შედეგად უფრო ეფექტური, შეკრული და ეფექტური AIOS-Agent ეკოსისტემა.

შემდეგი

ფიფქია არქტიკა: უახლესი LLM Enterprise AI-სთვის

არ გამოტოვოთ

შეუძლია თუ არა ხელოვნურმა ინტელექტს დაზღვევა უფრო ხელმისაწვდომი გახადოს?

კუნალ კეჯრივალი

"პროფესიით ინჟინერი, ზეპირად მწერალი". კუნალი არის ტექნიკური მწერალი, რომელსაც აქვს AI და ML ღრმა სიყვარული და გაგება, რომელიც ეძღვნება ამ სფეროებში რთული კონცეფციების გამარტივებას მისი საინტერესო და ინფორმაციული დოკუმენტაციის საშუალებით.