ხელოვნური გენერალური ინტელექტი

Inflection-2.5: The Powerhouse LLM Rivaling GPT-4 და Gemini

განახლებულია on მარტი 14, 2024

Inflection AI აფრქვევდა ტალღებს სფეროში დიდი ენის მოდელები (LLMs) ბოლო დროს გამოაქვეყნეს Inflection-2.5, მოდელი, რომელიც კონკურენციას უწევს მსოფლიოს წამყვან LLM-ებს, მათ შორის OpenAI-ს GPT-4 და Google-ის Gemini-ს.

Inflection AI-ს სწრაფმა ზრდამ კიდევ უფრო გააძლიერა მასიური $1.3 მილიარდი დაფინანსების რაუნდი, რომელსაც ხელმძღვანელობენ ინდუსტრიის გიგანტები, როგორიცაა Microsoft, NVIDIA და ცნობილი ინვესტორები, მათ შორის Reid Hoffman, Bill Gates და Eric Schmidt. ეს მნიშვნელოვანი ინვესტიცია კომპანიის მიერ მოზიდულ მთლიან დაფინანსებას 1.525 მილიარდ დოლარამდე აქცევს.

პარტნიორებთან CoreWeave და NVIDIA-სთან თანამშრომლობით, Inflection AI აშენებს მსოფლიოში ყველაზე დიდ AI კლასტერს, რომელიც მოიცავს უპრეცედენტო 22,000 NVIDIA H100 Tensor Core GPU-ს. ეს კოლოსალური გამოთვლითი ძალა ხელს შეუწყობს ახალი თაობის ფართომასშტაბიანი ხელოვნური ინტელექტის მოდელების მომზადებას და განლაგებას, რაც საშუალებას მისცემს Inflection AI-ს გადალახოს საზღვრები, რაც შესაძლებელია პირადი AI-ის სფეროში.

კომპანიის ინოვაციურმა მუშაობამ უკვე გამოიღო შესანიშნავი შედეგები, Inflection AI კლასტერთან ერთად, რომელიც ამჟამად მოიცავს 3,500-ზე მეტ NVIDIA H100 Tensor Core GPU-ს, რაც უზრუნველყოფს უახლესი ეფექტურობას ღია კოდის საორიენტაციო MLPerf-ზე. CoreWeave-თან და NVIDIA-სთან ერთობლივი წარდგენისას, კლასტერმა დაასრულა საცნობარო სასწავლო დავალება დიდი ენობრივი მოდელებისთვის სულ რაღაც 11 წუთში, რამაც გააძლიერა თავისი პოზიცია, როგორც ყველაზე სწრაფი კლასტერი ამ ეტალონზე.

ეს მიღწევა მოჰყვა Inflection-1-ის, Inflection AI-ის შიდა დიდი ენის მოდელის (LLM) გამოვლენას, რომელიც შეფასდა, როგორც საუკეთესო მოდელი თავის გამოთვლით კლასში. აჯობებს ინდუსტრიის გიგანტებს, როგორიცაა GPT-3.5, LLaMA, Chinchilla და PaLM-540B კრიტერიუმების ფართო სპექტრზე, რომლებიც ჩვეულებრივ გამოიყენება LLM-ების შესადარებლად, Inflection-1 საშუალებას აძლევს მომხმარებლებს ინტერაქციას Pi, Inflection AI-ის პირად AI-თან მარტივი და ბუნებრივი გზით. სწრაფი, შესაბამისი და გამოსადეგი ინფორმაციისა და რჩევების მიღება.

Inflection AI-ს ვალდებულება გამჭვირვალობისა და გამეორებისადმი აშკარაა ტექნიკური მემორანდუმის გამოქვეყნებაში, რომელიც დეტალურადაა აღწერილი Inflection-1-ის შეფასებასა და შესრულებაზე სხვადასხვა კრიტერიუმებზე. მემორანდუმი ცხადყოფს, რომ Inflection-1 აჯობებს მოდელებს იმავე გამოთვლით კლასში, განსაზღვრული, როგორც მოდელები, რომლებიც გაწვრთნილი არიან PaLM-540B-ის მაქსიმუმ FLOP-ების (მცურავი წერტილის ოპერაციების) გამოყენებით.

Inflection-1-ის წარმატება და კომპანიის გამოთვლითი ინფრასტრუქტურის სწრაფი მასშტაბირება, რომელიც გამოწვეულია მნიშვნელოვანი დაფინანსების რაუნდით, ხაზს უსვამს Inflection AI-ს ურყევ ერთგულებას მისი მისიის შესრულებაში - შექმნას პერსონალური AI ყველასთვის. Inflection-1-ის Pi-ში ინტეგრაციით, მომხმარებლებს ახლა შეუძლიათ განიცადონ პირადი AI-ის ძალა, ისარგებლონ მისი თანაგრძნობით, სარგებლიანობით და უსაფრთხოების სტანდარტებით.

ფლექცია-2.5

ფლექცია-2.5 ახლა უკვე ხელმისაწვდომია Pi-ის ყველა მომხმარებლისთვის, Inflection AI-ის პერსონალური AI ასისტენტი, მრავალ პლატფორმაზე, მათ შორის ვებსაიტზე (pi.ai), iOS-ზე, Android-ზე და დესკტოპის ახალ აპლიკაციაზე. ეს ინტეგრაცია აღნიშნავს მნიშვნელოვან ეტაპს Inflection AI-ის მისიაში, შექმნას პერსონალური AI ყველასთვის, რომელიც აერთიანებს ნედლეულ შესაძლებლობებს მათ ხელმოწერილ თანაგრძნობასთან და უსაფრთხოების სტანდარტებთან.

ნახტომი შესრულების Inflection AI-ის წინა მოდელი, Inflection-1, გამოიყენა GPT-4-ის სასწავლო FLOP-ების (მცურავი წერტილის ოპერაციების) დაახლოებით 4% და აჩვენა საშუალო შესრულება დაახლოებით 72% GPT-4-თან შედარებით სხვადასხვა IQ-ზე ორიენტირებული. დავალებები. Inflection-2.5-ით, Inflection AI-მ მიაღწია Pi-ს ინტელექტუალურ შესაძლებლობებს, აქცენტით კოდირებასა და მათემატიკაზე.

მოდელის ეფექტურობა ინდუსტრიის ძირითად კრიტერიუმებზე აჩვენებს მის ოსტატობას, აჩვენებს GPT-94-ის საშუალო შესრულების 4%-ზე მეტს სხვადასხვა ამოცანებში, განსაკუთრებული აქცენტით STEM სფეროებში წარმატებაზე. ეს გასაოცარი მიღწევა მოწმობს Inflection AI-ის ერთგულებაზე ტექნოლოგიური საზღვრების წინსვლისა და მომხმარებლის გამოცდილებასა და უსაფრთხოებაზე ურყევი ფოკუსირების შენარჩუნებისას.

კოდირება და მათემატიკის უნარი Inflection-2.5 ანათებს კოდირებასა და მათემატიკაში, რაც აჩვენებს 10%-ზე მეტ გაუმჯობესებას Inflection-1-ზე BIG-Bench-Hard-ზე, რთული პრობლემების ქვეჯგუფი დიდი ენობრივი მოდელებისთვის. კოდირების ორი საორიენტაციო ნიშანი, MBPP+ და HumanEval+, ავლენს უზარმაზარ გაუმჯობესებას Inflection-1-თან შედარებით, რაც აძლიერებს Inflection-2.5-ის პოზიციებს, როგორც ძალას კოდირების დომენში.

MBPP+ ბენჩმარკზე, Inflection-2.5 აჯობებს თავის წინამორბედს მნიშვნელოვანი ზღვრით, აჩვენებს შესრულების დონეს, რომელიც შედარებულია GPT-4-თან, როგორც იტყობინება DeepSeek Coder. ანალოგიურად, HumanEval+ ბენჩმარკზე, Inflection-2.5 აჩვენებს თვალსაჩინო პროგრესს, აჭარბებს Inflection-1-ის შესრულებას და უახლოვდება GPT-4 დონეს, როგორც ეს მოხსენებულია EvalPlus ლიდერბორდზე.

ინდუსტრიის საორიენტაციო დომინირება

Inflection-2.5 გამოირჩევა ინდუსტრიის კრიტერიუმებში, რომელიც აჩვენებს მნიშვნელოვან გაუმჯობესებას Inflection-1-თან შედარებით MMLU ბენჩმარკზე და GPQA Diamond-ის საორიენტაციო ნიშნულზე, რომელიც ცნობილია ექსპერტის დონის სირთულით. მოდელის შესრულება ამ კრიტერიუმებზე ხაზს უსვამს მის უნარს გაუმკლავდეს ამოცანების ფართო სპექტრს, საშუალო სკოლის დონის პრობლემებიდან პროფესიონალური დონის გამოწვევებამდე.

წარმატებები STEM გამოცდებში მოდელის ოსტატობა ვრცელდება STEM გამოცდებზე, უნგრეთის მათემატიკის გამოცდაზე და ფიზიკის GRE-ზე გამორჩეული შედეგებით. უნგრეთის მათემატიკის გამოცდაზე, Inflection-2.5 აჩვენებს თავის მათემატიკური უნარს მოწოდებული რამდენიმე კადრის მოთხოვნისა და ფორმატირების გამოყენებით, რაც გაადვილებს გამეორებას.

ფიზიკა GRE-ში, სამაგისტრო მისაღები გამოცდა ფიზიკაში, Inflection-2.5 აღწევს 85-ე პროცენტულს ადამიანთა ტესტებში maj@8-ში (ხმების უმრავლესობა 8-ზე), აძლიერებს თავის პოზიციას, როგორც ძლიერი კონკურენტი ფიზიკის პრობლემების გადაჭრის სფეროში. . გარდა ამისა, მოდელი უახლოვდება მაქსიმალურ ქულას maj@32-ში, რაც აჩვენებს მის უნარს, გადაჭრას რთული ფიზიკის პრობლემები შესანიშნავი სიზუსტით.

მომხმარებლის გამოცდილების Inflection-2.5 გაძლიერება არა მხოლოდ იცავს Pi-ს ხელმოწერის პიროვნებისა და უსაფრთხოების სტანდარტებს, არამედ ამაღლებს მის სტატუსს, როგორც მრავალმხრივი და ფასდაუდებელი პერსონალური AI სხვადასხვა თემებზე. მიმდინარე მოვლენების განხილვიდან დაწყებული ადგილობრივი რეკომენდაციების მოძიებამდე, გამოცდებისთვის სწავლა, კოდირება და თუნდაც ჩვეულებრივი საუბრები, Pi, რომელიც აღჭურვილია Inflection-2.5-ით, გვპირდება მომხმარებლის გამდიდრებულ გამოცდილებას.

Inflection-2.5-ის მძლავრი შესაძლებლობებით, მომხმარებლები ერთვებიან Pi-სთან თემების უფრო ფართო სპექტრზე, ვიდრე ოდესმე. მოდელის უნარი გაუმკლავდეს რთულ ამოცანებს, მის თანაგრძნობასთან და რეალურ დროში ვებ ძიების შესაძლებლობებთან ერთად, უზრუნველყოფს, რომ მომხმარებლები მიიღონ მაღალი ხარისხის, განახლებული ინფორმაცია და ხელმძღვანელობა.

მომხმარებლის მიღება და ჩართულობა Inflection-2.5-ის Pi-ში ინტეგრაციის გავლენა უკვე აშკარაა მომხმარებლის განწყობის, ჩართულობისა და შეკავების მეტრიკაში. Inflection AI მოწმე გახდა ორგანული მომხმარებლის ზრდის მნიშვნელოვანი დაჩქარება, ერთი მილიონი ყოველდღიური და ექვსი მილიონი ყოველთვიურად აქტიური მომხმარებელი გაცვლის ოთხ მილიარდზე მეტ შეტყობინებას Pi-სთან.

საშუალოდ, პისთან საუბარი 33 წუთს გრძელდება, მეათიდან ერთი კი დღეში ერთ საათზე მეტს გრძელდება. გარდა ამისა, ადამიანების დაახლოებით 60%, რომლებიც ურთიერთობენ Pi-სთან მოცემულ კვირაში, ბრუნდებიან მომდევნო კვირაში, რაც აჩვენებს უფრო მაღალ თვიურ წებოვნებას, ვიდრე ამ სფეროში წამყვანი კონკურენტები.

ტექნიკური დეტალები და საორიენტაციო გამჭვირვალობა

Inflection AI-ს გამჭვირვალობისა და განმეორებადობის ვალდებულების შესაბამისად, კომპანიამ წარმოადგინა ყოვლისმომცველი ტექნიკური შედეგები და დეტალები Inflection-2.5-ის მუშაობის შესახებ სხვადასხვა ინდუსტრიის ეტალონებში.

მაგალითად, MT-Bench მონაცემთა ნაკრების შესწორებულ ვერსიაზე, რომელიც აგვარებს საკითხებს არასწორი საცნობარო გადაწყვეტილებებისა და ნაკლოვანებებით თავდაპირველ მონაცემთა ბაზაში, Inflection-2.5 აჩვენებს შესრულებას სხვა კრიტერიუმებზე დაფუძნებული მოლოდინების შესაბამისად.

Inflection AI-მ ასევე შეაფასა Inflection-2.5 HellaSwag-ზე და ARC-C-ზე, საღი აზრისა და მეცნიერების კრიტერიუმები, რომლებიც მოხსენებულია მოდელების ფართო სპექტრით, და შედეგები აჩვენებს ძლიერ შესრულებას ამ გაჯერების კრიტერიუმებზე.

მნიშვნელოვანია აღინიშნოს, რომ მიუხედავად იმისა, რომ მოწოდებული შეფასებები წარმოადგენენ Pi-ს მოდელს, მომხმარებლის გამოცდილება შეიძლება ოდნავ განსხვავდებოდეს ისეთი ფაქტორების გამო, როგორიცაა ვებ-ძიების გავლენა (არ გამოიყენება ეტალონებში), რამდენიმე გასროლის მოთხოვნის სტრუქტურა და სხვა. წარმოების მხრიდან განსხვავებები.

დასკვნა

Inflection-2.5 წარმოადგენს მნიშვნელოვან წინსვლას დიდი ენობრივი მოდელების სფეროში, კონკურენციას უწევს ინდუსტრიის ლიდერების შესაძლებლობებს, როგორიცაა GPT-4 და Gemini, ხოლო გამოიყენებს გამოთვლითი რესურსების მხოლოდ მცირე ნაწილს. თავისი შთამბეჭდავი შესრულებით ბენჩმარკების ფართო სპექტრში, განსაკუთრებით STEM სფეროებში, კოდირებასა და მათემატიკაში, Inflection-2.5 პოზიციონირდა, როგორც შესანიშნავი კონკურენტი AI ლანდშაფტში.

Inflection-2.5-ის ინტეგრაცია Pi-ში, Inflection AI-ის პერსონალური AI-ის ასისტენტი, გვპირდება მომხმარებლის გამდიდრებულ გამოცდილებას, რომელიც აერთიანებს ნედლეულ შესაძლებლობებს თანაგრძნობით პიროვნებასთან და უსაფრთხოების სტანდარტებთან. როდესაც Inflection AI აგრძელებს LLM-ების საზღვრების გადალახვას, AI საზოგადოება მოუთმენლად ელის ინოვაციებისა და მიღწევების შემდეგ ტალღას ამ წარმატებული კომპანიისგან.

Inflection AI-ის ხედვითი მიდგომა სცილდება უბრალო მოდელის შემუშავებას, რადგან კომპანია აცნობიერებს წინასწარი ტრენინგის და დახვეწის მნიშვნელობას მაღალი ხარისხის, უსაფრთხო და სასარგებლო AI გამოცდილების შესაქმნელად. როგორც ვერტიკალურად ინტეგრირებული ხელოვნური ინტელექტის სტუდია, Inflection AI ამუშავებს მთელ პროცესს შიდა, მონაცემთა გადაყლაპვიდან და მოდელის დიზაინიდან დაწყებული მაღალი ხარისხის ინფრასტრუქტურამდე.

დაკავშირებული თემები:ტყუპები GPT-4 Inflection AI დიდი ენის მოდელები პალმ პერსონალური AI ასისტენტი

შემდეგი

რერანკერების ძალა და ორეტაპიანი მოძიება გაძლიერებული თაობის მოძიებისთვის

არ გამოტოვოთ

დომენის სპეციფიკური ენის მოდელების ზრდა

აიუშ მიტალი

გასული ხუთი წელი გავატარე მანქანათმცოდნეობის და ღრმა სწავლის მომხიბლავ სამყაროში ჩაძირვაში. ჩემმა გატაცებამ და გამოცდილებამ მიბიძგა, რომ წვლილი შემეტანა 50-ზე მეტ მრავალფეროვან პროგრამულ საინჟინრო პროექტში, განსაკუთრებული აქცენტით AI/ML-ზე. ჩემმა მუდმივმა ცნობისმოყვარეობამ ასევე მიმიზიდა ბუნებრივი ენის დამუშავებისკენ, სფერო, რომლის შემდგომი შესწავლა მსურს.