Τεχνητή νοημοσύνη

Η Cerebras παρουσιάζει την ταχύτερη λύση συμπερασμάτων AI στον κόσμο: Ταχύτητα 20x με κλάσμα του κόστους

Δημοσιευμένα Αύγουστος 27, 2024

Αντουάν Ταρντίφ, Διευθύνων Σύμβουλος & Ιδρυτής της Unite.AI

Συστήματα CerebrasΗ , πρωτοπόρος στον υπολογισμό τεχνητής νοημοσύνης υψηλής απόδοσης, παρουσίασε μια πρωτοποριακή λύση που πρόκειται να φέρει επανάσταση στην εξαγωγή συμπερασμάτων τεχνητής νοημοσύνης. Στις 27 Αυγούστου 2024, η εταιρεία ανακοίνωσε την κυκλοφορία της Cerebras Inference, της ταχύτερης υπηρεσίας συμπερασμάτων AI στον κόσμο. Με μετρήσεις απόδοσης που ξεπερνούν αυτές των παραδοσιακών συστημάτων που βασίζονται σε GPU, το Cerebras Inference προσφέρει 20 φορές μεγαλύτερη ταχύτητα με ένα κλάσμα του κόστους, θέτοντας ένα νέο σημείο αναφοράς στον υπολογισμό τεχνητής νοημοσύνης.

Πρωτοφανής ταχύτητα και αποδοτικότητα κόστους

Το Cerebras Inference έχει σχεδιαστεί για να προσφέρει εξαιρετική απόδοση σε διάφορα μοντέλα AI, ιδιαίτερα στο ταχέως εξελισσόμενο τμήμα του μεγάλα γλωσσικά μοντέλα (LLMs). Για παράδειγμα, επεξεργάζεται 1,800 μάρκες ανά δευτερόλεπτο για το μοντέλο Llama 3.1 8B και 450 μάρκες ανά δευτερόλεπτο για το μοντέλο Llama 3.1 70B. Αυτή η απόδοση δεν είναι μόνο 20 φορές ταχύτερη από αυτή των λύσεων που βασίζονται σε GPU NVIDIA, αλλά έχει επίσης σημαντικά χαμηλότερο κόστος. Η Cerebras προσφέρει αυτήν την υπηρεσία ξεκινώντας από μόλις 10 σεντ ανά εκατομμύριο μάρκες για το μοντέλο Llama 3.1 8B και 60 σεντ ανά εκατομμύριο μάρκες για το μοντέλο Llama 3.1 70B, αντιπροσωπεύοντας 100x βελτίωση στην τιμή-απόδοση σε σύγκριση με τις υπάρχουσες προσφορές που βασίζονται σε GPU.

Διατήρηση της ακρίβειας κατά την ώθηση των ορίων της ταχύτητας

Μία από τις πιο εντυπωσιακές πτυχές του Cerebras Inference είναι η ικανότητά του να διατηρεί ακρίβεια αιχμής, ενώ προσφέρει απαράμιλλη ταχύτητα. Σε αντίθεση με άλλες προσεγγίσεις που θυσιάζουν την ακρίβεια για την ταχύτητα, η λύση του Cerebras παραμένει εντός του τομέα των 16 bit για το σύνολο της εκτέλεσης συμπερασμάτων. Αυτό διασφαλίζει ότι τα κέρδη απόδοσης δεν έρχονται σε βάρος της ποιότητας των εξόδων μοντέλων τεχνητής νοημοσύνης, που αποτελεί κρίσιμο παράγοντα για τους προγραμματιστές που επικεντρώνονται στην ακρίβεια.

Ο Micah Hill-Smith, Συνιδρυτής και Διευθύνων Σύμβουλος της Artificial Analysis, τόνισε τη σημασία αυτού του επιτεύγματος:Η Cerebras προσφέρει ταχύτητες κατά μια τάξη μεγέθους μεγαλύτερες από τις λύσεις που βασίζονται σε GPU για τα μοντέλα Llama 3.1 8B και 70B AI της Meta. Μετράμε ταχύτητες πάνω από 1,800 διακριτικά εξόδου ανά δευτερόλεπτο στο Llama 3.1 8B και πάνω από 446 μάρκες εξόδου ανά δευτερόλεπτο στο Llama 3.1 70B – νέο ρεκόρ σε αυτά τα σημεία αναφοράς».

Η αυξανόμενη σημασία του συμπερασμάτων AI

Συμπέρασμα AI είναι το ταχύτερα αναπτυσσόμενο τμήμα της υπολογιστικής τεχνητής νοημοσύνης, αντιπροσωπεύοντας περίπου το 40% της συνολικής αγοράς υλικού τεχνητής νοημοσύνης. Η έλευση των συμπερασμάτων τεχνητής νοημοσύνης υψηλής ταχύτητας, όπως αυτή που προσφέρει η Cerebras, μοιάζει με την εισαγωγή του ευρυζωνικού Διαδικτύου - ξεκλειδώνοντας νέες ευκαιρίες και προαναγγέλλοντας μια νέα εποχή για εφαρμογές τεχνητής νοημοσύνης. Με το Cerebras Inference, οι προγραμματιστές μπορούν τώρα να δημιουργήσουν εφαρμογές τεχνητής νοημοσύνης επόμενης γενιάς που απαιτούν σύνθετες επιδόσεις σε πραγματικό χρόνο, όπως πράκτορες AI και έξυπνα συστήματα.

Ο Andrew Ng, ιδρυτής του DeepLearning.AI, υπογράμμισε τη σημασία της ταχύτητας στην ανάπτυξη της τεχνητής νοημοσύνης:Το DeepLearning.AI διαθέτει πολλαπλές ροές εργασιών με πράκτορες που απαιτούν επανειλημμένη προτροπή σε ένα LLM για να ληφθεί ένα αποτέλεσμα. Η Cerebras έχει δημιουργήσει μια εντυπωσιακά γρήγορη δυνατότητα εξαγωγής συμπερασμάτων που θα είναι πολύ χρήσιμη σε τέτοιους φόρτους εργασίας."

Ευρεία Βιομηχανική Υποστήριξη και Στρατηγικές Συνεργασίες

Η Cerebras έχει συγκεντρώσει ισχυρή υποστήριξη από τους ηγέτες του κλάδου και έχει δημιουργήσει στρατηγικές συνεργασίες για να επιταχύνει την ανάπτυξη εφαρμογών τεχνητής νοημοσύνης. Ο Kim Branson, SVP του AI/ML της GlaxoSmithKline, ένας πρώτος πελάτης της Cerebras, τόνισε τις δυνατότητες μετασχηματισμού αυτής της τεχνολογίας: «Η ταχύτητα και η κλίμακα αλλάζουν τα πάντα».

Άλλες εταιρείες, όπως η LiveKit, Αμηχανία, και Meter, εξέφρασαν επίσης ενθουσιασμό για τον αντίκτυπο που θα έχει η Cerebras Inference στις δραστηριότητές τους. Αυτές οι εταιρείες αξιοποιούν τη δύναμη των υπολογιστικών δυνατοτήτων της Cerebras για να δημιουργήσουν πιο ανταποκρινόμενες εμπειρίες τεχνητής νοημοσύνης που μοιάζουν με τον άνθρωπο, να βελτιώσουν την αλληλεπίδραση των χρηστών στις μηχανές αναζήτησης και να βελτιώσουν τα συστήματα διαχείρισης δικτύου.

Συμπεράσματα Cerebras: Tiers and Accessibility

Το Cerebras Inference είναι διαθέσιμο σε τρία επίπεδα ανταγωνιστικών τιμών: Δωρεάν, Προγραμματιστής και Επιχειρηματικό. Το Free Tier παρέχει δωρεάν πρόσβαση API με γενναιόδωρα όρια χρήσης, καθιστώντας το προσβάσιμο σε ένα ευρύ φάσμα χρηστών. Το Developer Tier προσφέρει μια ευέλικτη επιλογή ανάπτυξης χωρίς διακομιστή, με τα μοντέλα Llama 3.1 με τιμή 10 σεντς και 60 σεντς ανά εκατομμύριο μάρκες. Το Enterprise Tier απευθύνεται σε οργανισμούς με συνεχή φόρτο εργασίας, προσφέροντας βελτιωμένα μοντέλα, προσαρμοσμένες συμφωνίες επιπέδου υπηρεσιών και αποκλειστική υποστήριξη, με τιμολόγηση διαθέσιμη κατόπιν αιτήματος.

Powering Cerebras Inference: The Wafer Scale Engine 3 (WSE-3)

Στην καρδιά του Cerebras Inference βρίσκεται το σύστημα Cerebras CS-3, που τροφοδοτείται από την κορυφαία στον κλάδο Wafer Scale Engine 3 (WSE-3). Αυτός ο επεξεργαστής AI είναι απαράμιλλος στο μέγεθος και την ταχύτητά του, προσφέροντας 7,000 φορές περισσότερο εύρος ζώνης μνήμης από τον H100 της NVIDIA. Η τεράστια κλίμακα του WSE-3 του δίνει τη δυνατότητα να χειρίζεται πολλούς ταυτόχρονους χρήστες, εξασφαλίζοντας ταχύτητες με φουσκάλες χωρίς συμβιβασμούς στην απόδοση. Αυτή η αρχιτεκτονική επιτρέπει στο Cerebras να παρακάμπτει τις ανταλλαγές που συνήθως μαστίζουν συστήματα που βασίζονται σε GPU, παρέχοντας την καλύτερη απόδοση στην κατηγορία τους για φόρτους εργασίας AI.

Απρόσκοπτη ενσωμάτωση και φιλικό προς τους προγραμματιστές API

Το Cerebras Inference έχει σχεδιαστεί με γνώμονα τους προγραμματιστές. Διαθέτει ένα API που είναι πλήρως συμβατό με το OpenAI Chat Completions API, επιτρέποντας την εύκολη μετεγκατάσταση με ελάχιστες αλλαγές κώδικα. Αυτή η φιλική προς τους προγραμματιστές προσέγγιση διασφαλίζει ότι η ενσωμάτωση του Cerebras Inference στις υπάρχουσες ροές εργασίας είναι όσο το δυνατόν πιο απρόσκοπτη, επιτρέποντας την ταχεία ανάπτυξη εφαρμογών τεχνητής νοημοσύνης υψηλής απόδοσης.

Cerebras Systems: Driving Innovation Across Industries

Η Cerebras Systems δεν είναι απλώς ηγέτης στην πληροφορική τεχνητής νοημοσύνης, αλλά και βασικός παράγοντας σε διάφορους κλάδους, όπως η υγειονομική περίθαλψη, η ενέργεια, η κυβέρνηση, η επιστημονική πληροφορική και οι χρηματοοικονομικές υπηρεσίες. Οι λύσεις της εταιρείας συνέβαλαν καθοριστικά στην επίτευξη καινοτομιών σε ιδρύματα όπως τα National Laboratories, η Aleph Alpha, η The Mayo Clinic και η GlaxoSmithKline.

Παρέχοντας απαράμιλλη ταχύτητα, επεκτασιμότητα και ακρίβεια, η Cerebras δίνει τη δυνατότητα σε οργανισμούς σε αυτούς τους τομείς να αντιμετωπίσουν μερικά από τα πιο δύσκολα προβλήματα στην τεχνητή νοημοσύνη και όχι μόνο. Είτε πρόκειται για την επιτάχυνση της ανακάλυψης φαρμάκων στην υγειονομική περίθαλψη είτε για τη βελτίωση των υπολογιστικών δυνατοτήτων στην επιστημονική έρευνα, το Cerebras βρίσκεται στην πρώτη γραμμή της καινοτομίας.

Συμπέρασμα: Μια νέα εποχή για το συμπέρασμα AI

Η Cerebras Systems θέτει ένα νέο πρότυπο για την εξαγωγή συμπερασμάτων AI με την κυκλοφορία του Cerebras Inference. Προσφέροντας 20 φορές μεγαλύτερη ταχύτητα από τα παραδοσιακά συστήματα που βασίζονται σε GPU με ένα κλάσμα του κόστους, η Cerebras όχι μόνο κάνει την τεχνητή νοημοσύνη πιο προσιτή αλλά και ανοίγει το δρόμο για την επόμενη γενιά εφαρμογών τεχνητής νοημοσύνης. Με την τεχνολογία αιχμής, τις στρατηγικές συνεργασίες και τη δέσμευσή της στην καινοτομία, η Cerebras είναι έτοιμη να οδηγήσει τη βιομηχανία τεχνητής νοημοσύνης σε μια νέα εποχή άνευ προηγουμένου απόδοσης και επεκτασιμότητας.

Για περισσότερες πληροφορίες σχετικά με τα συστήματα Cerebras και για να δοκιμάσετε το Cerebras Inference, επισκεφθείτε www.cerebras.ai.

Σχετικά θέματα:Εγκεφαλικά

Επόμενο

Η Google κυκλοφορεί τρία νέα πειραματικά μοντέλα Gemini

Μην χάσετε

Επίδειξη γλώσσας AI: Σύγκριση της απόδοσης των C++, Python, Java και Rust

Αντουάν Ταρντίφ

Ο Antoine είναι οραματιστής ηγέτης και ιδρυτικός συνεργάτης της Unite.AI, οδηγούμενος από ένα ακλόνητο πάθος για τη διαμόρφωση και την προώθηση του μέλλοντος της AI και της ρομποτικής. Ως κατά συρροή επιχειρηματίας, πιστεύει ότι η τεχνητή νοημοσύνη θα είναι τόσο ενοχλητική για την κοινωνία όσο και ο ηλεκτρισμός και συχνά πιάνεται να κραυγάζει για τις δυνατότητες των τεχνολογιών και του AGI που προκαλούν αναστάτωση.

Ως μελλοντιστής, είναι αφοσιωμένος στην εξερεύνηση πώς αυτές οι καινοτομίες θα διαμορφώσουν τον κόσμο μας. Επιπλέον, είναι ο ιδρυτής του Securities.io, μια πλατφόρμα που επικεντρώνεται στην επένδυση σε τεχνολογίες αιχμής που επαναπροσδιορίζουν το μέλλον και αναδιαμορφώνουν ολόκληρους τομείς.

Unite.AI