სტუბი Lin Qiao, აღმასრულებელი დირექტორი და თანადამფუძნებელი Fireworks AI - ინტერვიუების სერია - Unite.AI
დაკავშირება ჩვენთან ერთად

ინტერვიუები

Lin Qiao, აღმასრულებელი დირექტორი და Fireworks AI - ინტერვიუს სერიის თანადამფუძნებელი

mm

გამოქვეყნებულია

 on

Lin Qiao, ადრე იყო Meta's PyTorch-ის ხელმძღვანელი და არის Fireworks AI-ის თანადამფუძნებელი და აღმასრულებელი დირექტორი. ფეიერვერკი AI არის წარმოების AI პლატფორმა, რომელიც შექმნილია დეველოპერებისთვის, Fireworks პარტნიორობს მსოფლიოს წამყვან გენერაციულ AI მკვლევარებთან, რათა მოემსახუროს საუკეთესო მოდელებს, უსწრაფესი სიჩქარით. Fireworks AI ცოტა ხნის წინ გაიზარდა ა $25 მილიონი სერია A.

მამაჩემი ძალიან უფროსი მექანიკოსი იყო გემთმშენებლობის ქარხანაში, სადაც სატვირთო გემებს ნულიდან ააგებდა. ბავშვობიდან ვისწავლე გემის ნახატების ზუსტი კუთხეების და ზომების კითხვა და მომეწონა.

მე ძალიან ვსწავლობდი STEM-ს საშუალო სკოლიდან მოყოლებული – ყველაფერს მათემატიკა, ფიზიკა და ქიმია ვჭამდი. ერთ-ერთი ჩემი საშუალო სკოლის დავალება იყო BASIC პროგრამირების შესწავლა და მე დავაშინე თამაში გველის შესახებ, რომელიც კუდს ჭამს. ამის შემდეგ ვიცოდი, რომ კომპიუტერული მეცნიერება ჩემს მომავალში იყო.

დიდი ტექნიკური კომპანიები, როგორიცაა Meta, ყოველთვის ხუთი ან მეტი წლით უსწრებენ მრუდს. როდესაც მე შევუერთდი Meta-ს 2015 წელს, ჩვენ ვიყავით ჩვენი AI მოგზაურობის დასაწყისში - CPU-დან GPU-ზე გადასვლა. ჩვენ უნდა შეგვექმნა ხელოვნური ინტელექტის ინფრასტრუქტურა თავიდანვე. მოდელები, როგორიცაა Caffe2, იყო ინოვაციური, როდესაც ისინი შეიქმნა, მაგრამ AI იმდენად სწრაფად განვითარდა, რომ ისინი სწრაფად მოძველდა. ჩვენ შევიმუშავეთ PyTorch და მის გარშემო არსებული მთელი სისტემა, როგორც გამოსავალი.

PyTorch არის ადგილი, სადაც შევიტყვე ყველაზე დიდი ბლოკირების შესახებ, რომლებსაც დეველოპერები აწყდებიან ხელოვნური ინტელექტის შესაქმნელად. პირველი გამოწვევა არის სტაბილური და საიმედო მოდელის არქიტექტურის პოვნა, რომელიც დაბალი შეყოვნებისა და მოქნილი იქნება, რათა მოდელებმა შეძლონ მასშტაბირება. მეორე გამოწვევა არის საკუთრების მთლიანი ღირებულება, ამიტომ კომპანიები არ გაკოტრდებიან თავიანთი მოდელების გაზრდის მცდელობით.

Meta-ში გატარებულმა დრომ მაჩვენა, თუ რამდენად მნიშვნელოვანია მოდელებისა და ჩარჩოების შენარჩუნება, როგორიცაა PyTorch ღია წყარო. ის ხელს უწყობს ინოვაციას. ჩვენ არ გავიზრდებოდით ისე, როგორც PyTorch-ში გამეორების ღია წყაროს შესაძლებლობების გარეშე. გარდა ამისა, შეუძლებელია თანამშრომლობის გარეშე განახლებული იყო ყველა უახლესი კვლევის შესახებ.

მე 20 წელზე მეტი ხნის განმავლობაში ვმუშაობ ტექნოლოგიურ ინდუსტრიაში და მინახავს ინდუსტრიის დონის ცვლილებების ტალღა-ტალღა – ღრუბლიდან მობილურ აპებამდე. მაგრამ ეს AI ცვლა არის სრული ტექტონიკური გადასწორება. მე ვნახე ბევრი კომპანია, რომელიც ებრძოდა ამ ცვლილებას. ყველას სურდა სწრაფად გადაადგილება და AI პირველ ადგილზე დაყენება, მაგრამ მათ არ აკლდათ ინფრასტრუქტურა, რესურსები და ნიჭი ამის განსახორციელებლად. რაც უფრო მეტს ველაპარაკებოდი ამ კომპანიებს, მით უფრო ვხვდებოდი, რომ შემეძლო ამ ხარვეზის მოგვარება ბაზარზე.

მე გავუშვი Fireworks AI, როგორც ამ პრობლემის გადასაჭრელად, ასევე იმ წარმოუდგენელი მუშაობის გაგრძელებას, რომელსაც მივაღწიეთ PyTorch-ში. ჩვენი სახელიც კი შთააგონა! PyTorch არის ჩირაღდანი, რომელსაც უჭირავს ცეცხლი - მაგრამ ჩვენ გვინდა, რომ ცეცხლი ყველგან გავრცელდეს. აქედან გამომდინარე: ფეიერვერკი.

მე ყოველთვის გატაცებული ვიყავი ტექნოლოგიების დემოკრატიზებით და დეველოპერებისთვის ინოვაციების ხელმისაწვდომობისა და მარტივი ქცევის მიუხედავად მათი რესურსების მიუხედავად. სწორედ ამიტომ გვაქვს მომხმარებლისთვის მოსახერხებელი ინტერფეისი და ძლიერი მხარდაჭერის სისტემები, რათა მშენებლებს მივცეთ მათი ხედვის რეალიზება.

ეს მარტივია: „დეველოპერზე ორიენტირებული“ ნიშნავს ხელოვნური ინტელექტის შემქმნელების საჭიროებების პრიორიტეტიზაციას. მაგალითად: ინსტრუმენტების, თემების და პროცესების შექმნა, რომლებიც დეველოპერებს უფრო ეფექტურს და ავტონომიურს ხდის.

დეველოპერებზე ორიენტირებული AI პლატფორმები, როგორიცაა Fireworks, უნდა იყოს ინტეგრირებული არსებულ სამუშაო პროცესებსა და ტექნიკურ დასტაში. მათ უნდა გაუადვილონ დეველოპერებს ექსპერიმენტების ჩატარება, შეცდომების დაშვება და მუშაობის გაუმჯობესება. მათ უნდა წაახალისონ გამოხმაურება, რადგან მისი დეველოპერები თავად ხვდებიან, რა სჭირდებათ წარმატების მისაღწევად. და ბოლოს, ეს უფრო მეტს ეხება, ვიდრე უბრალოდ პლატფორმა. საუბარია საზოგადოებაში ყოფნაზე – საზოგადოება, სადაც კოლაბორატორ დეველოპერებს შეუძლიათ გადალახონ საზღვრები, რაც შესაძლებელია ხელოვნური ინტელექტის საშუალებით.

ჩვენი მთელი მიდგომა, როგორც ხელოვნური ინტელექტის წარმოების პლატფორმა უნიკალურია, მაგრამ ჩვენი ზოგიერთი საუკეთესო მახასიათებელია:

ეფექტური დასკვნა – ჩვენ შევქმენით Fireworks AI ეფექტურობისა და სიჩქარისთვის. დეველოპერებს, რომლებიც იყენებენ ჩვენს პლატფორმას, შეუძლიათ თავიანთი LLM აპლიკაციების გაშვება ყველაზე დაბალი შესაძლო შეყოვნებითა და ფასით. ჩვენ ამას მივაღწევთ უახლესი მოდელისა და სერვისის ოპტიმიზაციის ტექნიკით, მათ შორის სწრაფი ქეშირების, ადაპტირებადი დაშლის, კვანტიზაციის, უწყვეტი ჯგუფური შეკრების, FireAttention და სხვა.

ხელმისაწვდომი მხარდაჭერა LoRA-თუნირებული მოდელებისთვის – ჩვენ გთავაზობთ დაბალი რანგის ადაპტაციის (LoRA) დახვეწილი მოდელების ხელმისაწვდომ სერვისს საბაზისო მოდელებზე მრავალჯერადი ქირავნობის საშუალებით. ეს ნიშნავს, რომ დეველოპერებს შეუძლიათ ექსპერიმენტი ჩაატარონ სხვადასხვა გამოყენების შემთხვევაში ან ვარიაციებით იმავე მოდელზე, ბანკის დარღვევის გარეშე.

მარტივი ინტერფეისები და API – ჩვენი ინტერფეისები და API-ები მარტივი და მარტივია დეველოპერებისთვის მათ აპლიკაციებში ინტეგრაციისთვის. ჩვენი API ასევე არის OpenAI თავსებადი მიგრაციის გამარტივებისთვის.

თაროზე მოთავსებული მოდელები და დახვეწილი მოდელები – ჩვენ გთავაზობთ 100-ზე მეტ წინასწარ მომზადებულ მოდელს, რომელთა გამოყენება დეველოპერებს შეუძლიათ შეუსაბამოდ. ჩვენ ვფარავთ საუკეთესო LLM-ებს, გამოსახულების გენერირების მოდელებს, ჩაშენების მოდელებს და ა.შ. მაგრამ დეველოპერებს ასევე შეუძლიათ აირჩიონ ჰოსტინგი და მოემსახურონ საკუთარ მოდელებს. ჩვენ ასევე ვთავაზობთ თვითმომსახურების დაზუსტების სერვისებს, რათა დავეხმაროთ დეველოპერებს ამ მორგებული მოდელების მორგებაში მათი საკუთრების მონაცემებით.

საზოგადოების თანამშრომლობა: ჩვენ გვჯერა საზოგადოების თანამშრომლობის ღია წყაროს ეთოსის. ჩვენი პლატფორმა მოუწოდებს (მაგრამ არ მოითხოვს) დეველოპერებს გაუზიარონ თავიანთი დახვეწილი მოდელები და წვლილი შეიტანონ ხელოვნური ინტელექტის აქტივებისა და ცოდნის მზარდ ბანკში. ყველა სარგებლობს ჩვენი კოლექტიური ექსპერტიზის გაზრდით.

მანქანათმცოდნეობის მოდელების პარალელიზება აუმჯობესებს მოდელის ტრენინგის ეფექტურობას და სიჩქარეს და ეხმარება დეველოპერებს გაუმკლავდნენ უფრო დიდ მოდელებს, რომლებსაც ერთი GPU ვერ ამუშავებს.

მოდელის პარალელიზმი გულისხმობს მოდელის მრავალ ნაწილად დაყოფას და თითოეული ნაწილის ცალკეულ პროცესორებზე მომზადებას. მეორეს მხრივ, მონაცემთა პარალელიზმი ყოფს მონაცემთა ნაკრებებს ქვეჯგუფებად და ამზადებს მოდელს თითოეულ ქვეჯგუფზე ერთდროულად ცალკეულ პროცესორებში. ჰიბრიდული მიდგომა აერთიანებს ამ ორ მეთოდს. მოდელები იყოფა ცალკეულ ნაწილებად, რომლებიც სწავლობენ მონაცემთა სხვადასხვა ქვეჯგუფებს, აუმჯობესებენ ეფექტურობას, მასშტაბურობას და მოქნილობას.

გულწრფელი ვიქნები, ბევრი მაღალი მთა იყო გადასაკვეთი მას შემდეგ, რაც 2022 წელს Fireworks AI დავაარსეთ.

ჩვენი მომხმარებლები პირველად მოვიდნენ ჩვენთან ძალიან დაბალი შეყოვნების მხარდაჭერისთვის, რადგან ისინი ქმნიან აპლიკაციებს მომხმარებლებისთვის, პროსუმერებისთვის ან სხვა დეველოპერებისთვის - ყველა აუდიტორიისთვის, რომელსაც სწრაფი გადაწყვეტილებები სჭირდება. შემდეგ, როდესაც ჩვენი მომხმარებლების აპლიკაციებმა სწრაფად დაიწყეს მასშტაბირება, ისინი მიხვდნენ, რომ ვერ ახერხებდნენ ამ მასშტაბთან დაკავშირებულ ტიპურ ხარჯებს. შემდეგ მათ გვთხოვეს დაგვეხმარა საკუთრების მთლიანი ღირებულების (TCO) შემცირებაში, რაც ჩვენ გავაკეთეთ. შემდეგ ჩვენს კლიენტებს სურდათ OpenAI-დან OSS მოდელებზე გადასვლა და მათ გვთხოვეს, რომ მიგვეწოდებინა თანაბარი ან თუნდაც უკეთესი ხარისხი, ვიდრე OpenAI. ეს ჩვენც მოვახერხეთ.

ჩვენი პროდუქტის ევოლუციის ყოველი ნაბიჯი იყო რთული პრობლემის მოგვარება, მაგრამ ეს იმას ნიშნავდა, რომ ჩვენი მომხმარებლების მოთხოვნილებებმა ფეიერვერკს ნამდვილად ჩამოაყალიბა ის, რაც დღეს არის: ელვისებური დასკვნის ძრავა დაბალი TCO-ით. გარდა ამისა, ჩვენ ვთავაზობთ როგორც მაღალი ხარისხის მოდელების ასორტიმენტს ასარჩევად, ასევე ვაუმჯობესებთ სერვისებს დეველოპერებისთვის, რომ შექმნან საკუთარი.

მე მყავს ორი თინეიჯერი ქალიშვილი, რომლებიც ხშირად იყენებენ genAI აპებს, როგორიცაა ChatGPT. როგორც დედა, მე ვღელავ, რომ მათ იპოვონ შეცდომაში შემყვანი ან შეუსაბამო შინაარსი, რადგან ინდუსტრია ახლახან იწყებს კონტენტის უსაფრთხოების კრიტიკულ პრობლემას. მეტა ბევრს აკეთებს Purple Llama პროექტთან ერთად და Stability AI-ის ახალი SD3 რეჟიმები შესანიშნავია. ორივე კომპანია ბევრს მუშაობს იმისთვის, რომ უსაფრთხოება შეუქმნას მათ ახალ Llama3 და SD3 მოდელებს ფილტრების მრავალ ფენით. შეყვანის-გამომავალი დამცავი მოდელი, Llama Guard, საკმაოდ ფართოდ გამოიყენება ჩვენს პლატფორმაზე, მაგრამ მისი მიღება ჯერ კიდევ არ არის სხვა LLM-ების თანაბარი. მთლიან ინდუსტრიას ჯერ კიდევ დიდი გზა აქვს გასავლელი კონტენტის უსაფრთხოებისა და ხელოვნური ინტელექტის ეთიკის წინა პლანზე წამოწევისთვის.

ჩვენ Fireworks-ში ღრმად ვზრუნავთ კონფიდენციალურობაზე და უსაფრთხოებაზე. ჩვენ ვართ HIPAA და SOC2 თავსებადი და გთავაზობთ უსაფრთხო VPC და VPN კავშირს. კომპანიები ენდობიან Fireworks-ს თავიანთ საკუთრებაში არსებულ მონაცემებსა და მოდელებს, რათა ააშენონ თავიანთი ბიზნესი.

ისევე, როგორც AlphaGo-მ აჩვენა ავტონომია ჭადრაკის დაკვრას დამოუკიდებლად სწავლისას, ვფიქრობ, რომ ჩვენ დავინახავთ, რომ genAI აპლიკაციები უფრო და უფრო ავტონომიური გახდება. აპები ავტომატურად მარშრუტებენ და მიმართავენ მოთხოვნებს სწორ აგენტზე ან API-ზე დასამუშავებლად და კურსს ასწორებენ, სანამ არ მოიპოვებენ სწორ გამომავალს. და იმის ნაცვლად, რომ ერთი ფუნქციის გამოძახების მოდელი გამოიკითხოს სხვებისგან, როგორც მაკონტროლებელი, ჩვენ დავინახავთ უფრო თვითორგანიზებულ, თვითკოორდინირებულ აგენტებს, რომლებიც მუშაობენ უნისონში პრობლემების გადასაჭრელად.

ფეიერვერკების ელვისებური დასკვნა, ფუნქციების გამოძახების მოდელები და დახვეწილი რეგულირების სერვისი გზა გაუხსნა ამ რეალობას. ახლა ეს ინოვაციურ დეველოპერებზეა დამოკიდებული.

გმადლობთ შესანიშნავი ინტერვიუსთვის, მკითხველს, ვისაც სურს მეტი გაიგოს, უნდა ეწვიოს ფეიერვერკი AI.

unite.AI-ს დამფუძნებელი პარტნიორი და წევრი Forbes-ის ტექნოლოგიური საბჭო, ანტუანი არის ა ფუტურისტი რომელიც გატაცებულია ხელოვნური ინტელექტისა და რობოტიკის მომავლის მიმართ.

ის ასევე არის დამფუძნებელი Securities.io, ვებსაიტი, რომელიც ფოკუსირებულია დამრღვევ ტექნოლოგიებში ინვესტირებაზე.