ინტერვიუები

ენდრიუ ფელდმანი, Cerebras Systems-ის თანადამფუძნებელი და აღმასრულებელი დირექტორი - ინტერვიუს სერია

გამოქვეყნებულია

1 წლის წინ

თებერვალი 13, 2023

ენდრიუ არის თანადამფუძნებელი და აღმასრულებელი დირექტორი ცერებრას სისტემები. ის არის მეწარმე, რომელიც ეძღვნება გამოთვლით სივრცეში საზღვრების გადალახვას. Cerebras-მდე ის იყო SeaMicro-ის თანადამფუძნებელი და აღმასრულებელი დირექტორი, ენერგოეფექტური, მაღალი გამტარუნარიანობის მიკროსერვერების პიონერი. SeaMicro შეიძინა AMD-მ 2012 წელს 357 მილიონ დოლარად. SeaMicro-მდე ენდრიუ იყო Force10 Networks-ის პროდუქტის მენეჯმენტის, მარკეტინგისა და BD ვიცე პრეზიდენტი, რომელიც მოგვიანებით Dell Computing-ს 800 მილიონ დოლარად მიჰყიდა. Force10 Networks-მდე, ენდრიუ იყო RiverStone Networks-ის მარკეტინგისა და კორპორატიული განვითარების ვიცე-პრეზიდენტი კომპანიის დაარსებიდან IPO-ს მეშვეობით 2001 წელს. ენდრიუ ფლობს ბაკალავრის ხარისხს და MBA-ს სტენფორდის უნივერსიტეტიდან.

Cerebras Systems აშენებს კომპიუტერული სისტემის ახალ კლასს, რომელიც შექმნილია პირველი პრინციპებიდან AI-ის დაჩქარებისა და ხელოვნური ინტელექტის მუშაობის მომავლის შესაცვლელად.

შეგიძლიათ გაგიზიაროთ ცერებრასის სისტემების წარმოშობის ისტორია?

მე და ჩემი თანადამფუძნებლები ერთად ვმუშაობდით წინა სტარტაპზე, რომელიც მე და ჩემმა CTO Gary-მ 2007 წელს დავიწყეთ, სახელწოდებით SeaMicro (რომელიც AMD-ზე გაიყიდა 2012 წელს 334 მილიონ დოლარად). ჩემი თანადამფუძნებლები არიან ზოგიერთი წამყვანი კომპიუტერული არქიტექტორი და ინჟინერი ინდუსტრიაში - გარი ლოტერბახი, შონ ლიი, ჯ.პ. ფრიკერი და მაიკლ ჯეიმსი. როდესაც ჯგუფი კვლავ შევიკრიბეთ 2015 წელს, ჩვენ დავწერეთ ორი რამ დაფაზე – რომ გვინდოდა ერთად გვემუშავა და რომ გვინდოდა ავაშენოთ ისეთი რამ, რაც გარდაქმნიდა ინდუსტრიას და კომპიუტერის ისტორიის მუზეუმში იქნებოდა, რაც უდრის. გამოთვლითი დიდების დარბაზი. ჩვენ პატივი გვქონდა, როდესაც კომპიუტერული ისტორიის მუზეუმმა აღიარა ჩვენი მიღწევები და დაამატა WSE-2 პროცესორი თავის კოლექციას გასულ წელს, იმ მოტივით, თუ როგორ გარდაქმნა მან ხელოვნური ინტელექტის ლანდშაფტი.

Cerebras Systems არის პიონერი კომპიუტერული არქიტექტორების, კომპიუტერის მეცნიერების, ღრმა სწავლის მკვლევარების და ყველა ტიპის ინჟინრების გუნდი, რომლებსაც უყვართ უშიშარი ინჟინერიის კეთება. ჩვენი მისია, როდესაც შევიკრიბეთ, იყო ახალი კლასის კომპიუტერის აგება ღრმა სწავლის დასაჩქარებლად, რომელიც გახდა ჩვენი დროის ერთ-ერთი ყველაზე მნიშვნელოვანი დატვირთვა.

ჩვენ მივხვდით, რომ ღრმა სწავლებას აქვს უნიკალური, მასიური და მზარდი გამოთვლითი მოთხოვნები. და ის კარგად არ ემთხვევა ძველ მანქანებს, როგორიცაა გრაფიკული დამუშავების ერთეულები (GPU), რომლებიც ფუნდამენტურად იყო შექმნილი სხვა სამუშაოებისთვის. შედეგად, AI დღეს შეზღუდულია არა აპლიკაციებით ან იდეებით, არამედ გამოთვლების ხელმისაწვდომობით. ერთი ახალი ჰიპოთეზის - ახალი მოდელის მომზადებას - შეიძლება დღეები, კვირები ან თვეებიც კი დასჭირდეს და გამოთვლილ დროში ასობით ათასი დოლარი დაჯდეს. ეს არის ინოვაციის მთავარი წინაღობა.

ასე რომ, ცერებრასის გენეზისი იყო ახალი ტიპის კომპიუტერის შექმნა, რომელიც ოპტიმიზირებულია ექსკლუზიურად ღრმა სწავლისთვის, დაწყებული სუფთა ფურცლიდან. ღრმა სწავლის უზარმაზარი გამოთვლითი მოთხოვნების დასაკმაყოფილებლად, ჩვენ დავაპროექტეთ და ვაწარმოეთ ყველაზე დიდი ჩიპი, რომელიც ოდესმე აშენებულა - Wafer-Scale Engine (WSE). მსოფლიოში პირველი ვაფლის მასშტაბის პროცესორის შექმნისას ჩვენ დავძლიეთ გამოწვევები დიზაინის, დამზადებისა და შეფუთვის კუთხით – ეს ყველაფერი შეუძლებლად ითვლებოდა კომპიუტერების 70-წლიანი ისტორიის განმავლობაში. WSE-ის ყველა ელემენტი შექმნილია იმისთვის, რომ უზრუნველყოს ღრმა სწავლის კვლევა უპრეცედენტო სიჩქარითა და მასშტაბით, რაც აძლიერებს ინდუსტრიის უსწრაფეს AI სუპერკომპიუტერს, Cerebras CS-2.

ხელოვნური ინტელექტის მუშაობისთვის ოპტიმიზირებული ყველა კომპონენტით, CS-2 უზრუნველყოფს მეტ გამოთვლით შესრულებას ნაკლებ სივრცეში და ნაკლებ ენერგიაზე, ვიდრე ნებისმიერი სხვა სისტემა. ის ამას აკეთებს მაშინ, როდესაც რადიკალურად ამცირებს პროგრამირების სირთულეს, კედლის საათის გამოთვლის დროს და გადაწყვეტის დროს. დატვირთვის მიხედვით, AI-დან HPC-მდე, CS-2 ასობით ან ათასობით ჯერ მეტ შესრულებას იძლევა, ვიდრე ძველი ალტერნატივები. CS-2 უზრუნველყოფს ღრმა სწავლის გამოთვლით რესურსებს, რომლებიც ექვივალენტურია ასობით GPU-ს, ამავდროულად უზრუნველყოფს ერთი მოწყობილობის პროგრამირების, მართვისა და განლაგების სიმარტივეს.

ბოლო რამდენიმე თვის განმავლობაში ცერებრები, როგორც ჩანს, მთელს მსოფლიოშია ახალი ამბები, რას გვეტყვით ახალი Andromeda AI სუპერკომპიუტერის შესახებ?

ჩვენ გამოვაცხადეთ ანდრომედა გასული წლის ნოემბერში და ის არის ერთ-ერთი უდიდესი და ყველაზე ძლიერი AI სუპერკომპიუტერი, რომელიც ოდესმე აშენდა. 1 Exaflop-ზე მეტი AI გამოთვლითი და 120 პეტაფლოპი მკვრივი გამოთვლებით, Andromeda-ს აქვს 13.5 მილიონი ბირთვი 16 CS-2 სისტემაში და არის ერთადერთი AI სუპერკომპიუტერი, რომელიც ოდესმე აჩვენებს თითქმის სრულყოფილ ხაზოვან სკალირებას დიდი ენობრივი მოდელების დატვირთვაზე. ის ასევე მარტივი გამოსაყენებელია.

შეგახსენებთ, რომ დედამიწაზე ყველაზე დიდი სუპერკომპიუტერი - Frontier-ს აქვს 8.7 მილიონი ბირთვი. ნედლეული ბირთვების რაოდენობაში, ანდრომედა ერთნახევარჯერ მეტია. აშკარად სხვაგვარად მუშაობს, მაგრამ ეს იძლევა წარმოდგენას მასშტაბის შესახებ: თითქმის 100 ტერაბიტი შიდა გამტარუნარიანობა, თითქმის 20,000 AMD Epyc ბირთვი კვებავს მას და – განსხვავებით გიგანტური სუპერკომპიუტერებისგან, რომლებსაც წლები სჭირდებათ – ჩვენ ანდრომედა სამ დღეში დავდგით. და ამის შემდეგ, იგი აწვდიდა AI-ს თითქმის სრულყოფილ ხაზოვან სკალირებას.

Argonne National Labs იყო ჩვენი პირველი მომხმარებელი, რომელმაც გამოიყენა ანდრომედა და მათ მიმართეს ის პრობლემაზე, რომელიც არღვევდა მათ 2,000 GPU კლასტერს სახელად Polaris. პრობლემა იყო ძალიან დიდი, GPT-3XL გენერაციული მოდელების გაშვება, ხოლო Covid-ის მთელი გენომის მიმდევრობის ფანჯარაში მოთავსება, ასე რომ თქვენ შეგეძლოთ თითოეული გენის ანალიზი Covid-ის მთელი გენომის კონტექსტში. ანდრომედამ აწარმოა უნიკალური გენეტიკური დატვირთვა გრძელი თანმიმდევრობის სიგრძით (MSL 10K) 1, 2, 4, 8 და 16 კვანძებში, თითქმის სრულყოფილი ხაზოვანი სკალირებით. ხაზოვანი მასშტაბირება დიდი კლასტერის ერთ-ერთი ყველაზე მოთხოვნადი მახასიათებელია. ანდრომედამ მიაწოდა 15.87X გამტარუნარიანობა 16 CS-2 სისტემაში, ერთ CS-2-თან შედარებით, და შეამცირა ვარჯიშის დრო შესატყვისად.

შეგიძლიათ გვითხრათ ამის შესახებ იასპერთან პარტნიორობა რომელიც ნოემბრის ბოლოს გამოქვეყნდა და რას ნიშნავს ეს ორივე კომპანიისთვის?

ჯასპერი მართლაც საინტერესო კომპანიაა. ისინი ლიდერები არიან გენერაციული AI კონტენტში მარკეტინგისთვის და მათ პროდუქტებს იყენებს 100,000-ზე მეტი მომხმარებელი მთელს მსოფლიოში, რათა დაწერონ ასლი მარკეტინგისთვის, რეკლამებისთვის, წიგნებისთვის და სხვა. ეს აშკარად ძალიან საინტერესო და სწრაფად მზარდი სივრცეა ახლა. გასულ წელს, ჩვენ გამოვაცხადეთ მათთან პარტნიორობა, რათა დააჩქაროს მიღება და გააუმჯობესოს გენერაციული AI-ის სიზუსტე საწარმოსა და სამომხმარებლო აპლიკაციებში. ჯასპერი იყენებს ჩვენს ანდრომედას სუპერკომპიუტერს, რათა მოამზადოს მისი ღრმად გამოთვლითი ინტენსიური მოდელები დროის მცირე მონაკვეთში. ეს გააფართოვებს გენერაციული AI მოდელების წვდომას მასებზე.

Cerebras Andromeda სუპერკომპიუტერის სიმძლავრით, ჯასპერს შეუძლია მკვეთრად წინ წაიწიოს ხელოვნური ინტელექტის მუშაობა, მათ შორის GPT ქსელების სწავლება, რათა მოერგოს AI გამომავალს საბოლოო მომხმარებლის სირთულისა და გრანულარობის ყველა დონეზე. ეს აუმჯობესებს გენერაციული მოდელების კონტექსტურ სიზუსტეს და საშუალებას მისცემს Jasper-ს მოახდინოს კონტენტის პერსონალიზირება მომხმარებელთა მრავალ კლასში სწრაფად და მარტივად.

ჩვენი პარტნიორობა ჯასპერს საშუალებას აძლევს გამოიგონოს გენერაციული AI-ის მომავალი, აკეთოს ისეთი რამ, რაც არაპრაქტიკული ან უბრალოდ შეუძლებელია ტრადიციული ინფრასტრუქტურით, და დააჩქაროს გენერაციული AI-ს პოტენციალი, რაც მის სარგებელს მოუტანს ჩვენს სწრაფად მზარდ მომხმარებელთა ბაზას მთელს მსოფლიოში.

ამ ბოლო დროს პრესრელიზიენერგეტიკული ტექნოლოგიების ეროვნულმა ლაბორატორიამ და პიტსბურგის სუპერკომპიუტერულმა ცენტრმა პიონერმა გამოაცხადეს პირველი გამოთვლითი სითხის დინამიკის სიმულაცია Cerebras ვაფლის მასშტაბის ძრავზე. შეგიძლიათ აღწეროთ კონკრეტულად რა არის ვაფლის მასშტაბის ძრავა და როგორ მუშაობს იგი?

ჩვენი ვაფლის სასწორის ძრავა (WSE) არის რევოლუციური AI პროცესორი ჩვენი ღრმა სწავლის კომპიუტერული სისტემისთვის, CS-2. მემკვიდრეობითი, ზოგადი დანიშნულების პროცესორებისგან განსხვავებით, WSE აშენდა თავიდან ბოლომდე ღრმა სწავლის დასაჩქარებლად: მას აქვს 850,000 AI ოპტიმიზებული ბირთვი იშვიათი ტენსორის ოპერაციებისთვის, მასიური მაღალი გამტარუნარიანობის ჩიპზე მეხსიერება და ურთიერთდაკავშირების მასშტაბები უფრო სწრაფად, ვიდრე ტრადიციული. კლასტერმა შესაძლოა მიაღწიოს. მთლიანობაში, ის გაძლევთ ღრმა სწავლის გამოთვლით რესურსებს, რომლებიც ექვივალენტურია ძველი მანქანების კლასტერს, ყველა ერთ მოწყობილობაში, ადვილად დასაპროგრამებლად, როგორც ერთი კვანძი - რადიკალურად ამცირებს პროგრამირების სირთულეს, კედლის საათის გამოთვლის დროს და გადაწყვეტის დროს.

ჩვენი მეორე თაობის WSE-2, რომელიც აძლიერებს ჩვენს CS-2 სისტემას, შეუძლია პრობლემების გადაჭრა ძალიან სწრაფად. საკმარისად სწრაფი, რათა დაუშვას რეალურ დროში, საინტერესო ინჟინერიული სისტემების მაღალი ერთგულების მოდელები. ეს არის წარმატებული „ძლიერი სკალირების“ იშვიათი მაგალითი, რომელიც არის პარალელიზმის გამოყენება ფიქსირებული ზომის პრობლემის გადაჭრის დროის შესამცირებლად.

და სწორედ ამისთვის იყენებს მას ეროვნული ენერგეტიკული ტექნოლოგიების ლაბორატორია და პიტსბურგის სუპერკომპიუტერული ცენტრი. ჩვენ ახლახან გამოვაცხადეთ გამოთვლითი სითხის დინამიკის (CFD) სიმულაციის მართლაც საინტერესო შედეგი, რომელიც შედგება დაახლოებით 200 მილიონი უჯრედისგან, რეალურ დროში თითქმის რეალურ დროში. ეს ვიდეო გვიჩვენებს Rayleigh-Bénard-ის კონვექციის მაღალი გარჩევადობის სიმულაციას, რომელიც ხდება მაშინ, როდესაც სითხის ფენა თბება ქვემოდან და გაცივდება ზემოდან. ეს თერმულად ამოძრავებული სითხის ნაკადები ჩვენს ირგვლივ არის - ქარიანი დღეებიდან, ტბის ეფექტის ქარბუქებამდე, მაგმის დენებით დედამიწის ბირთვში და პლაზმის მოძრაობამდე მზეში. როგორც მთხრობელი ამბობს, მნიშვნელოვანია არა მხოლოდ სიმულაციის ვიზუალური სილამაზე: ეს არის სიჩქარე, რომლითაც ჩვენ შეგვიძლია მისი გამოთვლა. პირველად, ჩვენი Wafer-Scale Engine-ის გამოყენებით, NETL-ს შეუძლია 200 მილიონი უჯრედისგან შემდგარი ბადის მანიპულირება თითქმის რეალურ დროში.

რა ტიპის მონაცემების სიმულაცია ხდება?

შემოწმებული სამუშაო დატვირთვა იყო თერმულად ამოძრავებული სითხის ნაკადები, ასევე ცნობილი როგორც ბუნებრივი კონვექცია, რომელიც წარმოადგენს გამოთვლითი სითხის დინამიკის (CFD) გამოყენებას. სითხის ნაკადები ბუნებრივად ხდება ჩვენს ირგვლივ - ქარიანი დღეებიდან, ტბის ეფექტიანი ქარბუქებით და ტექტონიკური ფირფიტების მოძრაობამდე. ეს სიმულაცია, რომელიც შედგება დაახლოებით 200 მილიონი უჯრედისგან, ფოკუსირებულია ფენომენზე, რომელიც ცნობილია როგორც "Rayleigh-Bénard" კონვექცია, რომელიც ხდება მაშინ, როდესაც სითხე თბება ქვემოდან და გაცივდება ზემოდან. ბუნებაში, ამ ფენომენმა შეიძლება გამოიწვიოს მძიმე ამინდის მოვლენები, როგორიცაა აფეთქება, მიკროაფეთქება და დერექო. ის ასევე პასუხისმგებელია მაგმის მოძრაობაზე დედამიწის ბირთვში და პლაზმის მოძრაობაზე მზეზე.

ჯერ კიდევ 2022 წლის ნოემბერში, NETL-მა წარმოადგინა ახალი ველის განტოლების მოდელირების API, რომელიც აღჭურვილია CS-2 სისტემით, რომელიც 470-ჯერ უფრო სწრაფი იყო ვიდრე NETL-ის Joule სუპერკომპიუტერზე იყო შესაძლებელი. ეს ნიშნავს, რომ მას შეუძლია მიაღწიოს სიჩქარეს, ვიდრე ნებისმიერი რაოდენობის CPU-ს ან GPU-ის კლასტერებს შეუძლიათ მიაღწიონ. Python-ის მარტივი API-ს გამოყენებით, რომელიც საშუალებას აძლევს ვაფლის მასშტაბის დამუშავებას გამოთვლითი მეცნიერების დიდი ნაწილისთვის, WFA აწვდის ეფექტურობასა და გამოყენებადობას, რაც ვერ მიიღწევა ჩვეულებრივ კომპიუტერებსა და სუპერკომპიუტერებზე – ფაქტობრივად, მან აჯობა OpenFOAM-ს NETL-ის Joule 2.0 სუპერკომპიუტერზე ორი რიგით მეტით. სიდიდის დროში გადაწყვეტამდე.

WFA API-ს სიმარტივის გამო, შედეგები მიღწეული იქნა სულ რამდენიმე კვირაში და განაგრძობს მჭიდრო თანამშრომლობას NETL-ს, PSC-სა და Cerebras Systems-ს შორის.

ჩვენს WSE-ზე CFD-ის სიჩქარის გარდაქმნით (რომელიც ყოველთვის იყო ნელი, ხაზგარეშე დავალება), ჩვენ შეგვიძლია გავხსნათ ახალი, რეალურ დროში გამოყენების შემთხვევების მთელი რიგი ამ და მრავალი სხვა ძირითადი HPC აპლიკაციისთვის. ჩვენი მიზანია, რომ მეტი გამოთვლითი სიმძლავრის ჩართვით, ჩვენს მომხმარებელს შეეძლოს მეტი ექსპერიმენტის ჩატარება და უკეთესი მეცნიერების გამოგონება. NETL-ის ლაბორატორიის დირექტორმა ბრაიან ანდერსონმა გვითხრა, რომ ეს მკვეთრად დააჩქარებს და გააუმჯობესებს დიზაინის პროცესს ზოგიერთი მართლაც დიდი პროექტისთვის, რომლებზეც NETL მუშაობს კლიმატის ცვლილების შერბილებისა და უსაფრთხო ენერგეტიკული მომავლის უზრუნველყოფის შესახებ - პროექტები, როგორიცაა ნახშირბადის სეკვესტრი და ლურჯი წყალბადის წარმოება.

Cerebras მუდმივად აჯობებს კონკურენციას, როდესაც საქმე სუპერკომპიუტერების გამოშვებას ეხება, რა არის ზოგიერთი გამოწვევა უახლესი სუპერკომპიუტერების აშენების უკან?

ბედის ირონიით, დიდი ხელოვნური ინტელექტის ერთ-ერთი ყველაზე რთული გამოწვევა არ არის AI. ეს არის განაწილებული გამოთვლა.

დღევანდელი უახლესი ნეირონული ქსელების მოსამზადებლად, მკვლევარები ხშირად იყენებენ ასობით ან ათასობით გრაფიკული დამუშავების ერთეულს (GPU). და ეს არ არის ადვილი. დიდი ენობრივი მოდელის ტრენინგის სკალირება GPU-ების კლასტერში მოითხოვს დატვირთვის განაწილებას ბევრ მცირე მოწყობილობაზე, მოწყობილობის მეხსიერების ზომებთან და მეხსიერების გამტარუნარიანობის შეზღუდვასთან და კომუნიკაციისა და სინქრონიზაციის ზედნადების გულდასმით მართვას.

ჩვენ სრულიად განსხვავებული მიდგომა მივიღეთ ჩვენი სუპერკომპიუტერების დიზაინის შემუშავების გზით ცერებრას ვაფლი-სკალის მტევანიდა ტვინის წონის ნაკადი შესრულების რეჟიმი. ამ ტექნოლოგიებით, Cerebras მიმართავს მასშტაბის ახალ გზას სამ ძირითად პუნქტზე დაყრდნობით:

CPU და GPU დამუშავების ჩანაცვლება ვაფლის მასშტაბის ამაჩქარებლებით, როგორიცაა Cerebras CS-2 სისტემა. ეს ცვლილება ამცირებს გამოთვლითი ერთეულების რაოდენობას, რომლებიც საჭიროა მისაღები გამოთვლითი სიჩქარის მისაღწევად.

მოდელის ზომის გამოწვევის დასაკმაყოფილებლად, ჩვენ ვიყენებთ სისტემის არქიტექტურას, რომელიც ანაწილებს გამოთვლებს მოდელის შენახვისგან. CS-2 სისტემების კლასტერზე დაფუძნებული გამოთვლითი სერვისი (ადეკვატური გამოთვლითი გამტარუნარიანობის უზრუნველყოფა) მჭიდროდ არის დაკავშირებული მეხსიერების სერვისთან (მეხსიერების დიდი ტევადობით), რომელიც უზრუნველყოფს მოდელის ქვეჯგუფებს გამოთვლით კლასტერს მოთხოვნისამებრ. ჩვეულებისამებრ, მონაცემთა სერვისი საჭიროების შემთხვევაში ემსახურება სასწავლო მონაცემების პარტიას გამოთვლით სერვისს.

ინოვაციური მოდელი CS-2 კლასტერში სასწავლო სამუშაოების დაგეგმვისა და კოორდინაციისთვის, რომელიც იყენებს მონაცემთა პარალელიზმს, ფენის ტრენინგს მწირი წონებით მოთხოვნის შესაბამისად და აქტივაციების შენარჩუნებას გამოთვლით სერვისში.

მურის კანონის დასასრულის შიში დაახლოებით ათი წელია არსებობს, კიდევ რამდენი წლის განმავლობაში შეუძლია ამ ინდუსტრიას შესუსტება და რა სახის ინოვაციებია საჭირო ამისათვის?

მე ვფიქრობ, რომ კითხვა, რომელსაც ჩვენ ყველანი ვცდილობთ, არის თუ არა მურის კანონი - როგორც მურის მიერ დაწერილი - მკვდარია. მეტი ტრანზისტორების მისაღებად ორი წელი არ არის საჭირო. ახლა ამას ოთხი ან ხუთი წელი სჭირდება. და ეს ტრანზისტორები არ გამოდიან იმავე ფასად - ისინი შემოდიან უაღრესად მაღალ ფასებში. ასე რომ, ჩნდება კითხვა, ვიღებთ თუ არა იგივე სარგებელს შვიდიდან ხუთ-სამ ნანომეტრამდე გადაადგილებით? სარგებელი უფრო მცირეა და ისინი უფრო ძვირია, ამიტომ გადაწყვეტილებები უფრო რთული ხდება, ვიდრე უბრალოდ ჩიპი.

ჯეკ დონგარა, წამყვანი კომპიუტერული არქიტექტორი, ცოტა ხნის წინ გამოვიდა მოხსენებით და თქვა: „ჩვენ ბევრად უკეთ გავხდით FLOP-ების და I/O-ს შექმნაში“. ეს მართლაც ასეა. ჩიპზე მონაცემების გადატანის ჩვენი უნარი მნიშვნელოვნად ჩამორჩება ჩიპზე მუშაობის გაზრდის უნარს. Cerebras-ში ჩვენ გახარებულები ვიყავით, როდესაც მან თქვა ეს, რადგან ეს ადასტურებს ჩვენს გადაწყვეტილებას შევქმნათ უფრო დიდი ჩიპი და გადავიტანოთ ნაკლები მასალა ჩიპიდან. ის ასევე გვაწვდის გარკვეულ მითითებებს ჩიპების მქონე სისტემების უკეთ მუშაობის სამომავლო გზებზე. სამუშაოა გასაკეთებელი, არა მხოლოდ მეტი FLOP-ის გაფუჭება, არამედ მათი გადაადგილების ტექნიკა და მონაცემების გადატანა ჩიპიდან ჩიპზე - თუნდაც ძალიან დიდი ჩიპიდან ძალიან დიდ ჩიპზე.

არის კიდევ რაიმე, რისი გაზიარებაც გსურთ Cerebras Systems-ის შესახებ?

უკეთესად თუ უარესად, ადამიანები ხშირად ათავსებენ ცერებრას ამ კატეგორიაში „ნამდვილად დიდი ჩიპების ბიჭები“. ჩვენ შევძელით ძალიან, ძალიან დიდი ნერვული ქსელების დამაჯერებელი გადაწყვეტილებების მიწოდება, რითაც აღმოვფხვრათ მტკივნეული განაწილებული გამოთვლის საჭიროება. მე მჯერა, რომ ეს ძალიან საინტერესოა და იმის საფუძველია, თუ რატომ გვიყვარს ჩვენს მომხმარებლებს. 2023 წლის საინტერესო დომენი იქნება ის, თუ როგორ უნდა გავაკეთოთ დიდი გამოთვლა უფრო მაღალი სიზუსტით, ნაკლები FLOP-ის გამოყენებით.

ჩვენი ნამუშევარი სპარსულობაზე იძლევა ძალიან საინტერესო მიდგომას. ჩვენ არ ვაკეთებთ სამუშაოს, რომელიც არ მიგვიყვანს გოლის ხაზისკენ და ნულზე გამრავლება ცუდი იდეაა. ჩვენ მალე გამოვაქვეყნებთ მართლაც საინტერესო ნაშრომს სიმცირის შესახებ და ვფიქრობ, მეტი ძალისხმევა იქნება საჭირო იმის გარკვევაში, თუ როგორ მივაღწიოთ ამ ეფექტურ წერტილებს და როგორ გავაკეთოთ ეს ნაკლები ენერგიისთვის. და არა მხოლოდ ნაკლები ენერგიისა და ვარჯიშისთვის; როგორ შევამციროთ დასკვნის დროს გამოყენებული ღირებულება და სიმძლავრე? ვფიქრობ, სიმცირე ორივე ფრონტზე ეხმარება.

გმადლობთ ამ სიღრმისეული პასუხებისთვის, მკითხველს, ვისაც სურს მეტი გაიგოს, უნდა ეწვიოს ცერებრას სისტემები.

დაკავშირებული თემები:ცერებრები ცერებრალური სისტემები ინტერვიუ

შემდეგი

Yotam Oren, Mona Labs-ის აღმასრულებელი დირექტორი და თანადამფუძნებელი - ინტერვიუს სერია

არ გამოტოვოთ

დოქტორი რამ შრიჰარშა, Pinecone-ის ინჟინერიის ვიცე – ინტერვიუს სერია

ანტუან ტარდიფი

unite.AI-ს დამფუძნებელი პარტნიორი და წევრი Forbes-ის ტექნოლოგიური საბჭო, ანტუანი არის ა ფუტურისტი რომელიც გატაცებულია ხელოვნური ინტელექტისა და რობოტიკის მომავლის მიმართ.

ის ასევე არის დამფუძნებელი Securities.io, ვებსაიტი, რომელიც ფოკუსირებულია დამრღვევ ტექნოლოგიებში ინვესტირებაზე.

Unite.AI

ენდრიუ ფელდმანი, Cerebras Systems-ის თანადამფუძნებელი და აღმასრულებელი დირექტორი - ინტერვიუს სერია

ინტერვიუები

ენდრიუ ფელდმანი, Cerebras Systems-ის თანადამფუძნებელი და აღმასრულებელი დირექტორი - ინტერვიუს სერია

სარჩევი

ბოლო პოსტები

Unite.AI

ენდრიუ ფელდმანი, Cerebras Systems-ის თანადამფუძნებელი და აღმასრულებელი დირექტორი - ინტერვიუს სერია

სარჩევი

შეიძლება მოგწონს

ბოლო პოსტები