Συνδεθείτε μαζί μας

Η OpenAI αξιοποιεί την Cerebras για 10 δισεκατομμύρια δολάρια σε υπολογιστική τεχνολογία χαμηλής καθυστέρησης

Συνεργασίες

Η OpenAI αξιοποιεί την Cerebras για 10 δισεκατομμύρια δολάρια σε υπολογιστική τεχνολογία χαμηλής καθυστέρησης

mm

Η OpenAI ανακοίνωσε μια πολυετή συμφωνία με την startup chip, Cerebras Systems, η οποία θα παρέχει 750 μεγαβάτ εξειδικευμένης υπολογιστικής τεχνητής νοημοσύνης στον κατασκευαστή του ChatGPT, κάτι που και οι δύο εταιρείες περιγράφουν ως... η μεγαλύτερη ανάπτυξη συμπερασμάτων υψηλής ταχύτητας επιχειρήθηκε ποτέ.

Η συμφωνία, η οποία αποτιμάται σε πάνω από 10 δισεκατομμύρια δολάρια σύμφωνα με πηγές που γνωρίζουν τους όρους, σηματοδοτεί το πιο σημαντικό στοίχημα της OpenAI σε υποδομές εκτός της κύριας σχέσης της με τη Microsoft. Η Cerebras θα κατασκευάσει και θα φιλοξενήσει τα συστήματα σε φάσεις έως το 2028, με την πρώτη χωρητικότητα να τίθεται σε λειτουργία φέτος.

Η συνεργασία στοχεύει σε ένα συγκεκριμένο πρόβλημα: την ταχύτητα. Ενώ το OpenAI έχει κλιμακώσει το ChatGPT σε 800 εκατομμύρια εβδομαδιαίοι χρήστες, η εταιρεία αντιμετωπίζει υπολογιστικούς περιορισμούς που επιβραδύνουν τους χρόνους απόκρισης — ιδιαίτερα για απαιτητικά φόρτα εργασίας όπως η δημιουργία κώδικα, οι εργασίες πρακτόρων και η φωνητική αλληλεπίδραση σε πραγματικό χρόνο.

«Η Cerebras προσθέτει μια εξειδικευμένη λύση συμπερασμάτων χαμηλής καθυστέρησης στην πλατφόρμα μας», δήλωσε ο Sachin Katti, επικεφαλής της υπολογιστικής στρατηγικής της OpenAI. «Αυτό σημαίνει ταχύτερες απαντήσεις, πιο φυσικές αλληλεπιδράσεις και μια ισχυρότερη βάση για την κλιμάκωση της Τεχνητής Νοημοσύνης σε πραγματικό χρόνο σε πολύ περισσότερους ανθρώπους».

Γιατί έχει σημασία το πυρίτιο σε κλίμακα γκοφρέτας

Η αρχιτεκτονική της Cerebras επικεντρώνεται στους επεξεργαστές κλίμακας wafer—τσιπ στο μέγεθος πιάτου που εξαλείφουν τις καθυστερήσεις επικοινωνίας που είναι εγγενείς σε συστήματα που συνδυάζονται από πολλές μικρότερες GPU. Η εταιρεία ισχυρίζεται ότι η αρχιτεκτονική της προσφέρει ταχύτητες συμπερασμάτων έως και 15 φορές ταχύτερες από τις εναλλακτικές λύσεις που βασίζονται σε GPU, με μοντέλα όπως το GPT-OSS-120B να λειτουργούν με περίπου 3,000 tokens ανά δευτερόλεπτο.

Για την OpenAI, αυτή η ταχύτητα μεταφράζεται άμεσα στην εμπειρία του χρήστη. Όταν η Τεχνητή Νοημοσύνη ανταποκρίνεται σε πραγματικό χρόνο—χωρίς την καθυστέρηση που κάνει τις συνομιλίες να μοιάζουν τεχνητές—οι χρήστες εμπλέκονται πιο βαθιά και επιτυγχάνουν περισσότερα. Η εταιρεία δοκίμασε το πυρίτιο της Cerebras με τα μοντέλα ανοιχτού βάρους της πριν από την Ημέρα των Ευχαριστιών και οι τεχνικές συνομιλίες μεταξύ των ομάδων κλιμακώθηκαν γρήγορα σε ένα υπογεγραμμένο φύλλο όρων, σύμφωνα με τον Διευθύνοντα Σύμβουλο της Cerebras, Andrew Feldman.

«Όπως ακριβώς το ευρυζωνικό δίκτυο μεταμόρφωσε το διαδίκτυο, έτσι και η συμπερασματολογία σε πραγματικό χρόνο θα μεταμορφώσει την Τεχνητή Νοημοσύνη», δήλωσε ο Φέλντμαν. «Αυτό επιτρέπει εντελώς νέους τρόπους δημιουργίας και αλληλεπίδρασης με μοντέλα Τεχνητής Νοημοσύνης».

Η σύγκριση δεν είναι υπερβολική. Το πρώιμο dial-up internet υποστήριζε email και βασική περιήγηση, η ροή βίντεο με δυνατότητα ευρυζωνικής σύνδεσης, οι φωνητικές κλήσεις και τελικά η οικονομία των εφαρμογών smartphone. Το OpenAI φαίνεται να στοιχηματίζει ότι η επαρκώς γρήγορη εξαγωγή συμπερασμάτων θα ξεκλειδώσει με παρόμοιο τρόπο εφαρμογές που η τρέχουσα καθυστέρηση καθιστά μη πρακτικές - ειδικά για τους πράκτορες τεχνητής νοημοσύνης που πρέπει να συνδέουν πολλαπλές λειτουργίες χωρίς να εξαντλείται η ανθρώπινη υπομονή.

Η κούρσα των εξοπλισμών σε υποδομές εντείνεται

Η συμφωνία με την Cerebras έρχεται ως εξής: Αποτιμήσεις υποδομών τεχνητής νοημοσύνης έχουν εκτοξευθεί, με την Databricks να συγκεντρώνει πρόσφατα κεφάλαια ύψους 134 δισεκατομμυρίων δολαρίων και την ίδια την Cerebras να φέρεται να βρίσκεται σε συνομιλίες για νέα χρηματοδότηση με αποτίμηση 22 δισεκατομμυρίων δολαρίων. Οι απαιτήσεις υπολογιστικής των μοντέλων πρωτοποριακής τεχνητής νοημοσύνης δεν δείχνουν σημάδια σταθεροποίησης και οι εταιρείες προσπαθούν να κλειδώσουν την παραγωγική τους ικανότητα πριν το κάνουν οι ανταγωνιστές.

Για την Cerebras, η συνεργασία με την OpenAI επιλύει ένα πρόβλημα συγκέντρωσης επιχειρήσεων. Η G42 των Ηνωμένων Αραβικών Εμιράτων αντιπροσώπευε το 87% των εσόδων της Cerebras κατά το πρώτο εξάμηνο του 2024 - μια συγκέντρωση πελατών που προκάλεσε νευρικότητα στους επενδυτές. Η προσθήκη της OpenAI ως σημαντικού πελάτη ενόψει μιας πιθανής αρχικής δημόσιας προσφοράς μειώνει σημαντικά τους κινδύνους για την επιχείρηση.

Για την OpenAI, η συμφωνία διαφοροποιεί την Υποδομή AI πέρα από το cloud Azure της Microsoft. Ενώ η Microsoft παραμένει ο κύριος πάροχος υπολογιστικών συστημάτων της OpenAI, η συνεργασία με την Cerebras παρέχει στην OpenAI αποκλειστική χωρητικότητα χαμηλής καθυστέρησης, βελτιστοποιημένη ειδικά για συμπερασματολογία - ένα διαφορετικό φόρτο εργασίας από τις εκτελέσεις εκπαίδευσης που χειρίζεται η υποδομή της Microsoft.

Ο χρόνος έχει επίσης σημασία. Το OpenAI κυκλοφόρησε πρόσφατα. GPT-5.2 Εν μέσω εντεινόμενου ανταγωνισμού από την Gemini της Google. Καθώς τα μοντέλα γίνονται πιο ικανά, οι εταιρείες που τα αναπτύσσουν ανακαλύπτουν ότι η ακατέργαστη νοημοσύνη δεν είναι αρκετή—οι χρήστες αναμένουν επίσης σχεδόν άμεσες απαντήσεις. Μια λαμπρή Τεχνητή Νοημοσύνη που χρειάζεται δέκα δευτερόλεπτα για να απαντήσει φαίνεται προβληματική. Η ίδια Τεχνητή Νοημοσύνη που απαντά σε λιγότερο από ένα δευτερόλεπτο μοιάζει μαγική.

Ο Σαμ Άλτμαν, Διευθύνων Σύμβουλος της OpenAI, είναι ήδη επενδυτής στην Cerebras, και η OpenAI κάποτε σκεφτόταν να αποκτήσει την εταιρεία απευθείας. Αυτή η συμφωνία υποδηλώνει ότι η σχέση εξελίσσεται σε κάτι πιο στρατηγικό: μια συνεργασία όπου οι τύχες και των δύο εταιρειών αλληλοσυνδέονται στον αγώνα για να κάνουν την Τεχνητή Νοημοσύνη να μοιάζει πραγματικά συνομιλιακή.

Ο Alex McFarland είναι δημοσιογράφος και συγγραφέας AI που εξερευνά τις τελευταίες εξελίξεις στην τεχνητή νοημοσύνη. Έχει συνεργαστεί με πολλές startups και εκδόσεις AI παγκοσμίως.