Συνεντεύξεις
Elad Raz, CEO της NextSilicon – Σειρά Συνεντεύξεων

Elad Raz, CEO της NextSilicon, είναι ένας έμπειρος επιχειρηματίας και ηγέτης τεχνολογίας που είναι ευρέως σεβασμένος για την sâuιά του εξειδίκευση σε χαμηλού επιπέδου συστήματα, ασφάλεια, δίκτυα και ανάπτυξη συστήματος αρχείων. Κατά τη διάρκεια μιας καριέρας που περιλαμβάνει εξαιρετικές στρατιωτικές μηχανικές ρόλους, ανώτερους ρόλους λογισμικού, δημιουργία εταιρειών και μακροχρόνια επενδύσεις, ο Raz έχει ηγηθεί σύνθετων, αποφασιστικών έργων σε εσωτερικά λειτουργικά συστήματα και ολοκλήρωση hardware-λογισμικού. Πριν από την ίδρυση της NextSilicon, έκτισε και εξόφλησε πολλές τεχνολογικές εταιρείες, υπηρέτησε σε ανώτερους ηγετικούς ρόλους σε μια ηγετική εταιρεία ημιαγωγών και επένδυσε σε ένα διαφοροποιημένο χαρτοφυλάκιο startup, συνδυάζοντας πρακτική εγγύτητα μηχανικής με ισχυρή εκτέλεση και μακροχρόνια στρατηγική όραση.
NextSilicon είναι μια ισραηλινή εταιρεία υψηλής απόδοσης υπολογιστών και ημιαγωγών που ιδρύθηκε το 2017 και αναedefίνει την αρχιτεκτονική υπολογισμού για απαιτητικές εργασίες όπως η τεχνητή νοημοσύνη και η επιστημονική υπολογιστική. Η εταιρεία έχει αναπτύξει μια λογισμικά-καθορίζουσα, έξυπνη πλατφόρμα υπολογισμού που σχεδιάζεται για την παραγωγή υψηλής απόδοσης και αποδοτικότητας χωρίς να απαιτεί από τους dévelopτερς να ξαναγράψουν τις εφαρμογές. Εστιάζοντας στην προσαρμοστικότητα στο επίπεδο hardware, η NextSilicon στοχεύει να αντιμετωπίσει τις θεμελιώδεις συμφόρες στα σύγχρονα κέντρα δεδομένων και περιβάλλοντα υπερυπολογιστών, θέτοντας τον εαυτό της ως μια επόμενη γενιά εναλλακτική λύση για τις παραδοσιακές επιταχυντές.
Μπορείτε να μας πείτε για το ταξίδι σας που οδήγησε στην ίδρυση της NextSilicon; Τι σπίθασε την αρχική ιδέα, και πώς οι πρώτες σας εμπειρίες με τον υπολογισμό σχήμασαν την όρασή σας;
Έχω εμπνευστεί από τους υπολογιστές από όταν ήμουν παιδί. Αυτή η σπίθα με οδήγησε από το να πειραματίζομαι με παλιούς Commodore 64 και Ataris (τα οποία ακόμα συλλέγω μέχρι σήμερα) στο να συνιδρύω startups, και τελικά στην πώληση της προηγούμενης εταιρείας μου στη Mellanox. Αλλά ακόμη και με αυτές τις πρώτες επιτυχίες, συνέχισα να βλέπω την ίδια πρόκληση ξανά και ξανά σε αυτόν τον κλάδο. Καθώς οι υπολογιστικές εργασίες έγιναν πιο σύνθετες, οι παραδοσιακές αρχιτεκτονικές CPU και GPU έφτασαν στα όρια απόδοσης, ενεργειακής αποδοτικότητας και κλιμάκωσης. Ανεξάρτητα από το αν βελτιώνω αλγόριθμους ή τρέχω μεγάλης κλίμακας симуляции, έγινε σαφές ότι οι τρέχουσες αρχιτεκτονικές έκαναν τις εργασίες να προσαρμοστούν στο hardware – όχι το αντίστροφο.
Η σπίθα για την NextSilicon προήλθε από αυτήν την επαναλαμβανόμενη πρόκληση και έθεσε το ερώτημα: Τι αν μπορούσαμε να ανατρέψουμε το σενάριο και να χτίσουμε αρχιτεκτονικές υπολογισμού που προσαρμόζονται στις εργασίες, αντί να τις αναγκάζουν να προσαρμοστούν στο hardware; Η πρώιμη μου έκθεση στο σχεδιασμό αλγορίθμων και hardware με δίδαξε ότι η πραγματική đột phá θα ήρθε από την συνδυαστική τους σε πραγματικό χρόνο. Αυτή είναι η βάση της Intelligent Compute Architecture (ICA) και της οδηγίας της NextSilicon από την αρχή.
Ο Maverick-2 περιγράφεται ως ένας Έξυπνος Επιταχυντής Υπολογισμού που προσαρμόζεται σε πραγματικό χρόνο στις εργασίες. Πώς διαφέρει η αρχιτεκτονική του από τις παραδοσιακές GPUs ή FPGAs, και τι την επιτρέπει να έχει αυτό το επίπεδο προσαρμοστικότητας;
Οι CPU και οι GPU έχουν μεταμορφώσει τον κόσμο μας και μας έχουν εξυπηρετήσει καλά. Αλλά δεν σχεδιάστηκαν ποτέ για να ανταποκριθούν στις απαιτήσεις των σύγχρονων AI και υψηλής απόδοσης υπολογιστικών εργασιών σε πεδία όπως η επιστήμη, ο καιρός, η ενέργεια και η άμυνα. Αυτές οι εργασίες έχουν σύνθετες εξαρτήσεις δεδομένων, μοτίβα πρόσβασης μνήμης και υπολογιστικών μοτίβα που οι σημερινές επεξεργαστές δεν σχεδιάστηκαν για να χειριστούν. Το αποτέλεσμα είναι οι συμφόρες που επιβραδύνουν την καινοτομία.
Η Maverick-2 διαφέρει με μια νέα προσέγγιση που συνδυάζει einen αναδιατασσόμενο κινητήρα ροής δεδομένων με βελτιστοποίηση λογισμικού σε πραγματικό χρόνο. Η κλειδί αρχιτεκτονική διαφορά είναι ότι το hardware ρυθμίζεται βάσει της εργασίας σας, όχι το αντίστροφο. Για την Maverick-2, η διαθεσιμότητα δεδομένων οδηγεί τον υπολογισμό, αντί για einen προγραμματισμό που οδηγεί την εκτέλεση εντολών όπως στις παραδοσιακές επεξεργαστές. Αυτό μας επιτρέπει να δημιουργήσουμε λογισμικά-καθορίζουμενες εικονικές μονάδες επεξεργασίας που μπορούν να ρυθμιστούν και να αναρυθμιστούν σε πραγματικό χρόνο για να ταιριάζουν σε συγκεκριμένα μοτίβα εργασιών.
Τα αποτελέσματα μιλούν από μόνα τους: η Maverick-2 προσφέρει πάνω από 4 φορές την απόδοση-ανά-βατ σε σχέση με τις GPU και πάνω από 20 φορές σε σχέση με τις CPU υψηλής απόδοσης, ενώ μειώνει τους λειτουργικούς κόστους κατά περισσότερο από το μισό. Jako αποτέλεσμα, οι ερευνητές και οι μηχανικοί μπορούν να τρέχουν μεγάλες, ανώμαλες симуляσεις γρηγορότερα και πιο αποτελεσματικά, ξεκλειδώνοντας γνώσεις και καινοτομίες σε μια κλάσμα του χρόνου.
Έχετε αναφέρει ότι έχετε επιτύχει πάνω από 4 φορές την απόδοση-ανά-βατ σε σχέση με τις GPU και πάνω από 20 φορές σε σχέση με τις CPU υψηλής απόδοσης. Ποίες είναι οι κλειδικές καινοτομίες που οδηγούν σε αυτές τις αυξήσεις απόδοσης σε πραγματικές εργασίες;
Οι αυξήσεις απόδοσης προέρχονται από quelques κλειδικές καινοτομίες που δουλεύουν μαζί.
Πρώτα, απομακρυνθήκαμε από το μοντέλο Von Neumann που κυριαρχεί στον υπολογισμό για 80 χρόνια. Αντί της σειριακής εκτέλεσης εντολών, η Maverick-2 χρησιμοποιεί μια αρχιτεκτονική ροής δεδομένων όπου ο υπολογισμός ακολουθεί την διαθεσιμότητα δεδομένων. Αυτό είναι θεμελιωδώς καλύτερο για ανώμαλες, μνήμη-εντατικές εργασίες.
Δεύτερον, η αυτο-βελτιστοποιημένη αρχιτεκτονική μας παράγει λογισμικά-καθορίζουμενες πυρήνες επεξεργαστή σε πραγματικό χρόνο. Το hardware προσαρμόζεται στις ανάγκες κάθε εφαρμογής χωρίς να απαιτείται αναγραφή κώδικα – έχετε βελτιστοποίηση χωρίς την επιβάρυνση.
Τρίτον, και αυτό είναι κρίσιμο: εστιάζουμε στην πραγματική, διατηρημένη απόδοση σε πραγματικές εργασίες, όχι σε θεωρητικά πίκα. Πολλές αρχιτεκτονικές φαίνονται καλές σε χαρτί αλλά αποτυγχάνουν σε πραγματικές εργασίες. Η Maverick-2 διατηρεί την αποδοτικότητα σε AI, υψηλής απόδοσης υπολογισμό και διανυσματικές βάσεις δεδομένων, συνεχίζοντας να προσαρμόζεται στις ανάγκες της εργασίας.
Η Maverick-2 υποστηρίζει C/C++, Fortran, OpenMP και Kokkos χωρίς να απαιτείται αλλαγή κώδικα. Πώς έχουν ανταποκριθεί οι dévelopτερς σε αυτήν την συμβατότητα, και ποίες είναι οι προοπτικές σας για την υποστήριξη CUDA, ROCm ή δημοφιλών πλαισίων AI;
Οι dévelopτερς αγαπούν ότι η Maverick-2 είναι μια γνήσια “απλή αντικατάσταση”. Μπορούν να τρέχουν τις υπάρχουσες εφαρμογές τους αμέσως χωρίς τις μπαράζ που πλήττουν αυτόν τον κλάδο. Υποστηρίζουμε C/C++, Fortran, OpenMP και Kokkos out of the box, με CUDA, ROCm και σημαντικά πλαισια AI όπως TensorFlow, JAX, PyTorch και ONNX σε ενεργό ανάπτυξη. Αυτό εξαλείφει την κλειδωμένη σχέση με τον προμηθευτή και τις δαπανηρές αναγραφές κώδικα και επιτρέπει στους πελάτες να αξιολογούν και να υιοθετούν νέες αρχιτεκτονικές χωρίς να διαταράσσουν τις ροές εργασιών τους.
Πώς λειτουργεί το σύστημα βελτιστοποίησης τηλεμετρίας της Maverick-2; Τι εμπλέκεται στην προφίλ και την αναδιαμόρφωση του chip σε πραγματικό χρόνο;
Σκεφτείτε την βελτιστοποίηση του συστήματος μας ως μια συνεχής λούπα: κατά την εκτέλεση, το σύστημα τηλεμετρίας μας μετρά εκατοντάδες指δείκτες απόδοσης (π.χ. εύρος ζώνης μνήμης, χρησιμοποίηση, βάθους ουράς). Όλα αυτά τα δεδομένα τροφοδοτούνται σε einen βελτιστοποιητή χρόνου εκτέλεσης που καθορίζει αν η τρέχουσα ρύθμιση hardware παραμένει βέλτιστη για την εργασία και τις προβλεπόμενες ανάγκες της. Αν όχι, μπορεί να αναδιαμορφώσει τους πόρους, να αναδιατάξει τα μονοπάτια δεδομένων και να προσαρμόσει τις πιπ-λίνιες υπολογισμού συνεχώς, με αποτέλεσμα η εφαρμογή να μην σταματά. Αυτό συμβαίνει μέσα σε χιλιοστά του δευτερολέπτου, οπότε η εφαρμογή διατηρεί τη συνεχή πικ απόδοση καθώς το υπολογιστικό της προφίλ αλλάζει.
Υπάρχουν συγκεκριμένοι τύποι εργασιών ή περιπτώσεις όπου η προσαρμοστική βελτιστοποίηση απόδοσης σε πραγματικό χρόνο είναι λιγότερο αποτελεσματική ή εισάγει εμπορευματοποίηση σε καθυστέρηση ή ενέργεια;
Κάθε αρχιτεκτονική θα έχει εμπορευματοποιήσεις. Η Maverick-2 εξέχει σε σύνθετες, ανώμαλες εργασίες με μεταβαλλόμενες υπολογιστικές και πρόσβασης δεδομένων μοτίβα. Για πολύ προβλέψιμες, σταθερές εργασίες, μια καλά-ρυθμισμένη GPU μπορεί να είναι πολύ αποτελεσματική χωρίς την επιβάρυνση της προσαρμοστικότητας. Σε αυτές τις περιπτώσεις, η προσαρμοστικότητά μας ακόμα προσφέρει στερεή απόδοση, αλλά το σχετικό πλεονέκτημα μπορεί να είναι μικρότερο.
Η σχεδίαση της NextSilicon είναι όλα για την πολυμορφία και την ανταγωνιστικότητα σε απλές περιπτώσεις, αλλά μετασχηματιστική σε απαιτητικές.
Γιατί αποφασίσατε να προτεραιοποιήσετε την αγορά υψηλής απόδοσης υπολογισμού από νωρίς, όταν οι περισσότερες startups έτρεχαν στην AI; Πώς έχει διαμορφώσει αυτό την προϊοντική και επιχειρηματική σας στρατηγική;
Η αγορά υψηλής απόδοσης υπολογισμού αντιπροσωπεύει το μέτωπο της υπολογιστικής сложικότητας και της επίλυσης προβλημάτων για τεράστιες βάσεις δεδομένων, ανώμαλες πρόσβασης μνήμης και απρόβλεπτους υπολογιστικούς μοτίβους. Αν μπορείτε να χτίσετε μια αρχιτεκτονική που ευδοκιμεί εκεί – όπως το τρέξιμο εξαμπάιτ-κλίμακας симуляσεων σε κλιματική μοντελοποίηση ή σωματική φυσική, θα ευδοκιμήσει και στην AI.
Εστιάζοντας στην αγορά υψηλής απόδοσης υπολογισμού πρώτα, αποδείξαμε την Maverick-2 στις πιο απαιτητικές εργασίες στην κλιματική μοντελοποίηση, φυσική και βιοεπιστήμες. Αυτό μας έδωσε αξιοπιστία, πραγματική απόδοση δεδομένων και một ωριμάζουσα προϊόν πριν μεταφερθούμε sâu hơn στις αγορές AI. Τώρα, είμαστε σε θέση να εξυπηρετούμε και τις δύο, χωρίς να έχουμε συμβιβάσει την αρχιτεκτονική μας για να κεφαλαιοποιήσουμε τις βραχυπρόθεσμες τάσεις ή ανάγκες.
Τώρα που η Maverick-2 είναι σε παραγωγή και έχει αναπτυχθεί σε δεκάδες πελάτες, μπορείτε να μοιραστείτε παραδείγματα για το πώς χρησιμοποιείται; Υπάρχουν συγκεκριμένα αποτελέσματα ή αναμετρήσεις από τις σημαντικές αναπτύξεις;
Ένα σημαντικό παράδειγμα είναι η ανάπτυξή μας στο Sandia National Labs, όπου η Maverick-2 τροφοδοτεί τον υπερυπολογιστή Spectra ως μέρος του προγράμματος Vanguard-II. Βλέπουμε εντυπωσιακά αποτελέσματα απόδοσης out of the box χωρίς να απαιτούνται αλλαγές κώδικα. Εργαζόμαστε επίσης με το ODISSEE (Online Data Intensive Solutions for Science in the Exabytes Era), το οποίο συνδυάζει κορυφαία ερευνητικά ιδρύματα για την αντιμετώπιση εξαμπάιτ-κλίμακας δεδομένων από το CERN’s High-Luminosity Large Hadron Collider και το Square Kilometre Array Observatory. Ο ρόλος της Maverick-2 θα είναι η επίλυση της πρόκλησης της επεξεργασίας πετάβαιτ raw πειραματικών δεδομένων σε μια κλάσμα του χρόνου και της ενέργειας που απαιτείτο προηγουμένως. Το τελικό στόχο είναι να ενεργοποιήσει ταχύτερες φυσικές αναλύσεις και αστρονομικές ανακαλύψεις.
Έχετε συγκεντρώσει πάνω από 300 εκατομμύρια δολάρια, με σημαντικές στροφές που ανακοινώθηκαν το 2021 και πιο πρόσφατα. Μπορείτε να μοιραστείτε πώς η χρηματοδότηση αυτή έχει επιταχύνει την ανάπτυξη του προϊόντος και την αγορά σας;
Η χρηματοδότηση επέτρεψε να κάνουμε τρία πράγματα. Πρώτα, μπορούσαμε να ωθήσουμε την αρχιτεκτονικήさらに, όχι μόνο σταδιακές βελτιώσεις, αλλά θεμελιώδεις προόδους που έκαναν την Maverick-2 έτοιμη για παραγωγή. Δεύτερον, καλιέραμε την παραγωγή και την αλυσίδα εφοδιασμού μας για να ανταποκριθούμε στην αυξανόμενη ζήτηση, μια μη εύκολη πρόκληση για νέο silicon. Τρίτον, επέκτεινα το οικοσύστημα λογισμικού μας για να ενεργοποιήσουμε τους πελάτες να ενσωματώσουν και να αναπτύξουν γρηγορότερα.
Επίσης, μας επέτρεψε στρατηγικές συνεργασίες με κέντρα υπερυπολογισμού και παρόχους cloud, επιτρέποντάς μας να ροκανίσουμε τη διαδικασία από την концепτοποίηση στην ανάπτυξη και να επεκταθούμε πολύ γρηγορότερα από τις παραδοσιακές startups hardware.
Σε ένα τοπίο που περιλαμβάνει Cerebras, SambaNova και Nvidia, πώς βλέπετε την NextSilicon να θέτει τον εαυτό της; Ποιά είναι η στρατηγική σας για την αγορά ως μια προκλητική;
Βλέπουμε την NextSilicon ως μια εταιρεία τεχνολογίας και όχι μόνο μια εταιρεία chip. Βελτιστοποιούμε κάθε εργασία, προσφέρουμε προσαρμοστικότητα και δεν κλειδώνουμε τους πελάτες μας σε ιδιοκτησιακό προγραμματισμό ή hardware. Οι πελάτες μας μπορούν να φέρουν τον υπάρχοντα κώδικα τους και να επιτύχουν άμεση επιτάχυνση χωρίς τις μακρές αναγραφές κώδικα ή την κλειδωμένη σχέση με τον προμηθευτή σε ένα seul οικοσύστημα, όπως το CUDA. Αυτό έχει σημασία ιδιαίτερα καθώς οι εργασίες AI εξελίσσονται πέρα από την καθαρή εκπαίδευση. Μοντέλα συλλογισμού, επέκταση συλλογισμού και μεγάλες παράθυρα контекστούν απαιτούν θεμελιωδώς διαφορετικά υπολογιστικά μοτίβα: πιο δυναμική πρόσβαση μνήμης, μεταβλητού μήκους υπολογισμού και προσαρμοστική ανάθεση πόρων. Αυτά δεν είναι προβλήματα που λύνονται με περισσότερο από την ίδια σταθερή αρχιτεκτονική.
Η στρατηγική μας για την αγορά εστιάζει στην επίλυση των πιο δύσκολων προβλημάτων πρώτα: εργαζόμαστε με ερευνητικά ιδρύματα, εθνικά εργαστήρια και επιχειρήσεις όπου η απόδοση, η ενεργειακή αποδοτικότητα και η ευελιξία είναι κρίσιμες. Από εκεί, επεκτείνουμε σε ευρύτερες αγορές AI και δεδομένων. Η βιομηχανία κυριαρχείται από σταθερές αρχιτεκτονικές. Προσφέρουμε κάτι διαφορετικό, προσαρμοστικότητα που χτίστηκε από την αρχή. Η AI μετατοπίζεται από την καθαρή κλίμακα στην ευφυΐα. Μεγαλύτερα μοντέλα επιτρέπουν έξυπνο συλλογισμό, από σύντομες προτροπές σε μακρά παράθυρα контекστούν. Σε αυτήν τη μετάβαση, οι προσαρμοστικές αρχιτεκτονικές δεν θα είναι μόνο καινοτόμες, θα είναι απαραίτητες.
Ευχαριστούμε για τη μεγάλη συνέντευξη, οι αναγνώστες που επιθυμούν να μάθουν περισσότερα πρέπει να επισκεφθούν NextSilicon.












