Συνδεθείτε μαζί μας

Κριτική βιβλίου: Η Μηχανή Σκέψης: Ο Jensen Huang, η NVIDIA και το πιο πολυπόθητο μικροτσίπ στον κόσμο από τον Stephen Witt

Βιβλιοκρισίες

Κριτική βιβλίου: Η Μηχανή Σκέψης: Ο Jensen Huang, η NVIDIA και το πιο πολυπόθητο μικροτσίπ στον κόσμο από τον Stephen Witt

mm

Η Μηχανή Σκέψης: Ο Jensen Huang, η NVIDIA και το πιο περιζήτητο μικροτσίπ στον κόσμο ξεχωρίζει από τα περισσότερα βιβλία που έχουν γραφτεί για την τεχνητή νοημοσύνη, επειδή προσεγγίζει το θέμα από μια κατεύθυνση που πολλοί τεχνικά εγγράμματοι αναγνώστες, συμπεριλαμβανομένου και εμού, ιστορικά έχουν υποτιμήσει.

Όπως πολλοί άνθρωποι που παρακολουθούν την Τεχνητή Νοημοσύνη εδώ και χρόνια, η κατανόησή μου για τον τομέα διαμορφώθηκε από γνωστά ορόσημα. Η ιστορία συνήθως ξεκινάει στο 1956 με το εργαστήριο του Ντάρτμουθ, μετακινείται μέσα από πρώιμα συμβολικά συστήματα και στη συνέχεια μεταβαίνει σε ορόσημα όπως η IBM Οι Deep Blue νικούν τον Garry Kasparov, DeepMind, τελειοποίηση του Goκαι πιο πρόσφατα το OpenAI που αποδεικνύει ότι τα μοντέλα μεγάλων γλωσσών μπορούν να συντονίσουν τη στρατηγική σε σύνθετα περιβάλλοντα για πολλούς παίκτες. Αυτές οι στιγμές είναι πνευματικά ικανοποιητικές και εύκολες στην απομνημόνευση επειδή επικεντρώνονται σε ορατές νίκες.

Αυτό που κάνει εξαιρετικά καλά το βιβλίο του Stephen Witt είναι να αμφισβητεί αυτό το πλαίσιο. Αντί να εστιάζει σε στιγμές που η Τεχνητή Νοημοσύνη εντυπωσίασε τον κόσμο, Η Μηχανή Σκέψης εστιάζει στο λιγότερο ορατό στρώμα κάτω από αυτά τα επιτεύγματα. Υποστηρίζει, πειστικά, ότι η σύγχρονη εποχή της Τεχνητής Νοημοσύνης δεν ξεκλειδώθηκε κυρίως μόνο από έξυπνες ιδέες, αλλά από μια θεμελιώδη αλλαγή στον τρόπο με τον οποίο εκτελούνταν οι ίδιοι οι υπολογισμοί.

Εστιάζοντας την αφήγηση στην NVIDIA (NVDA + 0.47%) και ο συνιδρυτής της, Jensen Huang, ο Witt αναδιατυπώνει την επανάσταση της Τεχνητής Νοημοσύνης ως μια ιστορία για την αρχιτεκτονική υπολογιστών, τα οικοσυστήματα προγραμματιστών και τη μακροπρόθεσμη πεποίθηση. Το αποτέλεσμα δεν είναι απλώς μια εταιρική βιογραφία, αλλά ένα κεφάλαιο που λείπει από την ευρύτερη ιστορία της τεχνητής νοημοσύνης.

Από τα βιντεοπαιχνίδια σε ένα νέο παράδειγμα πληροφορικής

Οι αρχές της NVIDIA απέχουν πολύ από τις υψηλές φιλοδοξίες που συνδέονται τώρα με την τεχνητή νοημοσύνη. Η εταιρεία εμφανίστηκε το 1993 ως κατασκευαστής τσιπ γραφικών, επικεντρώθηκε στην απόδοση ολοένα και πιο ρεαλιστικών κόσμων βιντεοπαιχνιδιών. Η πρόκληση εκείνη την εποχή δεν ήταν η νοημοσύνη, αλλά η ταχύτητα. Τα παιχνίδια απαιτούσαν την άμεση εκτέλεση τεράστιου αριθμού υπολογισμών για την προσομοίωση του φωτός, της κίνησης και του βάθους.

Η λύση που επεδίωξε η NVIDIA ήταν παράλληλος υπολογισμός. Η παράλληλη υπολογιστική σημαίνει την εκτέλεση πολλών υπολογισμών ταυτόχρονα αντί να εκτελούνται διαδοχικά. Αντί να βασίζονται σε έναν μόνο ισχυρό πυρήνα που επεξεργάζεται τη μία εντολή μετά την άλλη, οι GPU χρησιμοποιούν χιλιάδες μικρότερους πυρήνες που εργάζονται ταυτόχρονα σε παρόμοιες μαθηματικές πράξεις. Αυτή η προσέγγιση είναι ιδιαίτερα ισχυρή για φόρτους εργασίας που περιλαμβάνουν την επανάληψη των ίδιων υπολογισμών σε μεγάλα σύνολα δεδομένων.

Αρχικά, αυτή η αρχιτεκτονική δημιουργήθηκε για γραφικά. Ωστόσο, ο Witt δείχνει πώς αυτή η απόφαση δημιούργησε αθόρυβα την ιδανική βάση για νευρωνικά δίκτυα δεκαετίες αργότερα. Η εκπαίδευση σύγχρονων μοντέλων τεχνητής νοημοσύνης περιλαμβάνει τεράστιο αριθμό πανομοιότυπων μαθηματικών πράξεων που εφαρμόζονται σε τεράστιες ποσότητες δεδομένων. Οι GPU είχαν ήδη βελτιστοποιηθεί ακριβώς για αυτό το είδος εργασίας.

Αυτό που κάνει αυτό το μέρος του βιβλίου συναρπαστικό είναι το πόσο ξεκάθαρα ο Witt συνδέει τις επιλογές τεχνικού σχεδιασμού με την επιβίωση. Η NVIDIA δεν επέλεξε την παράλληλη υπολογιστική επειδή προέβλεψε την τεχνητή νοημοσύνη. Την επέλεξε επειδή ήταν ο μόνος τρόπος για να ανταγωνιστεί σε γραφικά πραγματικού χρόνου. Αυτή η αναγκαιότητα ανάγκασε την εταιρεία να τελειοποιήσει ένα υπολογιστικό μοντέλο που αργότερα θα αποδεικνυόταν μετασχηματιστικό πολύ πέρα ​​από τα παιχνίδια.

Ο Jensen Huang και η σκέψη σε συστήματα, όχι σε προϊόντα

Στο επίκεντρο αυτής της ιστορίας βρίσκεται ο Jensen Huang, ο οποίος δεν παρουσιάζεται ως ένα συμβατικό στέλεχος, αλλά ως κάποιος που σκεφτόταν με συνέπεια σε συστήματα και όχι σε μεμονωμένα προϊόντα. Ο Witt παρουσιάζει τον Huang ως απαιτητικό, έντονο και συχνά δύσκολο, αλλά και αξιοσημείωτα συνεπή στον τρόπο που έβλεπε την τεχνολογία για μεγάλα χρονικά διαστήματα.

Ενώ οι ανταγωνιστές αντιμετώπιζαν τις GPU ως αναλώσιμα εξαρτήματα συνδεδεμένα με τους κύκλους παιχνιδιών, ο Huang τις αντιμετώπιζε ως το θεμέλιο μιας ευρύτερης πλατφόρμας υπολογιστών. Αυτή η διάκριση καθίσταται κρίσιμη. Τα προϊόντα αντικαθίστανται. Οι πλατφόρμες συνδυάζονται.

Εσωτερικά, η NVIDIA αντανακλούσε αυτή τη νοοτροπία. Οι μηχανικοί ενθαρρύνονταν να σκέφτονται χρόνια μπροστά. Το λογισμικό αντιμετωπίζονταν ως στρατηγικά σημαντικό όσο το πυρίτιο. Οι επενδύσεις σε εργαλεία και υποστήριξη προγραμματιστών έγιναν πολύ πριν υπάρξει σαφής ζήτηση. Πολλές από αυτές τις επιλογές φάνηκαν υπερβολικές ή περιττές εκείνη την εποχή. Εκ των υστέρων, δημιούργησαν μια τάφρο που οι ανταγωνιστές δυσκολεύονταν να διασχίσουν.

Ο Witt ξεκαθαρίζει ότι η άνοδος της NVIDIA δεν ήταν αναπόφευκτη. Η εταιρεία έφτασε κοντά στην αποτυχία περισσότερες από μία φορές. Αυτό που την οδήγησε μπροστά δεν ήταν μια μεμονωμένη σημαντική ανακάλυψη, αλλά μια διαρκής πεποίθηση ότι η επιταχυνόμενη υπολογιστική τεχνολογία θα είχε τελικά σημασία πολύ πέρα ​​από την αρχική της χρήση.

Η CUDA και η ιστορία προέλευσης της τεχνητής νοημοσύνης που πολλοί παρέλειψαν

Μία από τις σημαντικότερες συνεισφορές του Η Μηχανή Σκέψης είναι ο τρόπος με τον οποίο επαναπροσδιορίζει τον ρόλο της CUDA στην ιστορία της Τεχνητής Νοημοσύνης.

Πριν διαβάσετε αυτό το βιβλίο, είναι εύκολο να σκεφτείτε CUDA ως απλώς ένα επιτυχημένο εργαλείο προγραμματιστών. Ο Witt δείχνει γιατί αξίζει πολύ περισσότερη προσοχή. Το CUDA δημιουργήθηκε για να κάνει την παράλληλη υπολογιστική χρήσιμη εκτός των γραφικών. Πριν από το CUDA, η χρήση GPU για γενικούς υπολογισμούς απαιτούσε την επιβολή προβλημάτων μέσω διεπαφών ειδικών για γραφικά. Αυτό ήταν εύθραυστο, αναποτελεσματικό και περιοριζόταν σε ειδικούς.

Το CUDA άλλαξε αυτό επιτρέποντας στους προγραμματιστές να προγραμματίζουν GPU χρησιμοποιώντας γνωστά μοντέλα προγραμματισμού. Χιλιάδες πυρήνες υπολογιστών έγιναν προσβάσιμοι ως γενικός πόρος. Αυτό μείωσε το εμπόδιο εισόδου σε υπολογιστές υψηλής απόδοσης με τρόπο που λίγοι άνθρωποι εκτίμησαν πλήρως εκείνη την εποχή.

Εδώ ακριβώς το βιβλίο συνέπεσε έντονα με τη δική μου εμπειρία από την εκμάθηση της ιστορίας της Τεχνητής Νοημοσύνης. Η αφήγηση που αφομοίωσα επικεντρώθηκε σε μεγάλο βαθμό σε μοντέλα και αλγόριθμους. Η Μηχανή Σκέψης καθιστά σαφές ότι πολλές από αυτές τις ιδέες έγιναν πρακτικές μόνο όταν οι ερευνητές μπόρεσαν πραγματικά να τις εφαρμόσουν σε μεγάλη κλίμακα.

Οι ερευνητές της τεχνητής νοημοσύνης αναγνώρισαν γρήγορα ότι τα νευρωνικά δίκτυα ήταν σχεδόν τέλεια επιλογή για παράλληλη υπολογιστική. Η εκπαίδευση περιλαμβάνει την επανάληψη των ίδιων λειτουργιών σε μεγάλα σύνολα δεδομένων, προσαρμόζοντας εκατομμύρια ή δισεκατομμύρια παραμέτρους με την πάροδο του χρόνου. Η CUDA επέτρεψε σε αυτή τη διαδικασία να συμβεί ταχύτερα, φθηνότερα και πιο αξιόπιστα από ό,τι θα μπορούσαν ποτέ οι CPU.

Αυτό απέκτησε ιδιαίτερη σημασία καθώς η βαθιά μάθηση επιταχύνθηκε και αργότερα, καθώς εμφανίστηκαν μοντέλα που βασίζονται σε μετασχηματιστές. Οι μετασχηματιστές ευδοκιμούν σε κλίμακα. Χωρίς την επιτάχυνση της GPU, πολλά από τα μοντέλα που καθορίζουν το σημερινό τοπίο της Τεχνητής Νοημοσύνης θα παρέμεναν θεωρητικά ή απαγορευτικά ακριβά. Η CUDA δεν εφηύρε αυτές τις αρχιτεκτονικές, αλλά κατέστησε δυνατή την ταχεία εξέλιξή τους.

Αυτό που αποτυπώνει ιδιαίτερα καλά ο Witt είναι ότι αυτό το αποτέλεσμα δεν ήταν πλήρως σχεδιασμένο. Το CUDA δημιουργήθηκε για επιστημονικούς υπολογισμούς. Οι ερευνητές τεχνητής νοημοσύνης ανακάλυψαν τη δύναμή του και έφεραν την NVIDIA στο επίκεντρο της κούρσας της τεχνητής νοημοσύνης.

Υποδομή πάνω από αλγόριθμους

Μία από τις πιο πολύτιμες γνώσεις του βιβλίου είναι ότι η πρόοδος της Τεχνητής Νοημοσύνης περιορίζεται τόσο από τις υποδομές όσο και από τις ιδέες. Πολλές δημοφιλείς αφηγήσεις επικεντρώνονται σε αλγόριθμους, κόλπα εκπαίδευσης και σύνολα δεδομένων. Η Μηχανή Σκέψης υπενθυμίζει στον αναγνώστη ότι τίποτα από αυτά δεν έχει σημασία χωρίς επαρκή υπολογιστική ισχύ.

Από αυτή την οπτική γωνία, το σύγχρονη άνθηση της τεχνητής νοημοσύνης φαίνεται λιγότερο ξαφνικό και πιο καθυστερημένο. Τα νευρωνικά δίκτυα υπήρχαν εδώ και δεκαετίες. Αυτό που άλλαξε ήταν η διαθεσιμότητα υλικού ικανού να τα εκπαιδεύσει σε ουσιαστική κλίμακα.

Η NVIDIA δεν παρείχε απλώς ταχύτερα τσιπ. Δημιούργησε ένα οικοσύστημα υλικού, βιβλιοθηκών λογισμικού και εργαλείων προγραμματιστών που ενισχύονταν μεταξύ τους με την πάροδο του χρόνου. Καθώς οι ερευνητές βελτιστοποιούσαν την εργασία τους για τις πλατφόρμες NVIDIA, η NVIDIA βελτίωσε τα προϊόντα της για να εξυπηρετεί καλύτερα τα φόρτα εργασίας τεχνητής νοημοσύνης. Αυτός ο βρόχος ανατροφοδότησης δημιούργησε ένα διαρκές πλεονέκτημα που επεκτάθηκε πολύ πέρα ​​από την ακατέργαστη απόδοση.

Το βιβλίο υπογραμμίζει με σιγουριά μια πραγματικότητα που είναι ολοένα και πιο προφανής σήμερα: η ηγεσία στην Τεχνητή Νοημοσύνη διαμορφώνεται από τις αλυσίδες εφοδιασμού, την παραγωγική ικανότητα, τα οικοσυστήματα λογισμικού και τον έλεγχο των πλατφορμών, όχι μόνο από την ερευνητική λαμπρότητα.

Όραμα, Κίνδυνος και Συνέπειες Σύνθεσης

Ο Witt δεν αποφεύγει τις επιπτώσεις της κυριαρχίας της NVIDIA. Καθώς η εταιρεία καθίσταται θεμελιώδης για την παγκόσμια υποδομή τεχνητής νοημοσύνης, η επιρροή της αυξάνεται αναλόγως. Η πεποίθηση του Jensen Huang ότι η επιταχυνόμενη πληροφορική θα καθορίσει την επόμενη φάση της τεχνολογικής προόδου διατρέχει όλο το βιβλίο.

Αντί να ηθικολογεί, Η Μηχανή Σκέψης εστιάζει στο πώς η συνεπής μηχανική και οι στρατηγικές αποφάσεις επιδεινώθηκαν με την πάροδο του χρόνου. Η NVIDIA δεν κέρδισε κυνηγώντας τις τάσεις. Κέρδισε δεσμευόμενη νωρίς στην παράλληλη υπολογιστική, αντέχοντας τους επαναλαμβανόμενους κύκλους της αγοράς και επενδύοντας αδιάκοπα στα εργαλεία που καθιστούσαν το υλικό της απαραίτητο.

Για αναγνώστες που θέλουν να κατανοήσουν πώς η τεχνητή νοημοσύνη έχει πραγματικά κλιμακωθεί

Για αναγνώστες που γνωρίζουν ήδη τις κύριες στιγμές του Ιστορία της Τεχνητής Νοημοσύνης, αυτό το βιβλίο συμπληρώνει το στρώμα που λείπει από κάτω. Εξηγεί γιατί αυτές οι ανακαλύψεις μπόρεσαν να κλιμακωθούν όταν συνέβησαν και γιατί η NVIDIA αναδείχθηκε ως μια τόσο κεντρική δύναμη σε αυτή τη διαδικασία.

Αυτό το βιβλίο απευθύνεται σε αναγνώστες που θέλουν να κατανοήσουν την τεχνητή νοημοσύνη ως ένα βιομηχανικό σύστημα και όχι ως μια συλλογή έξυπνων μοντέλων. Θα έχει έντονη απήχηση σε όσους ενδιαφέρονται για τα τσιπ, τα κέντρα δεδομένων και τις συχνά αόρατες μηχανικές αποφάσεις που διαμορφώνουν αθόρυβα την τεχνολογική ισχύ.

Η Μηχανή Σκέψης πετυχαίνει επειδή αναδιατυπώνει την ιστορία της Τεχνητής Νοημοσύνης από την αρχή, δείχνοντας πώς η παράλληλη υπολογιστική, οι πλατφόρμες προγραμματιστών και το μακροπρόθεσμο όραμα έχτισαν τα θεμέλια πάνω στα οποία στηρίζεται πλέον η σύγχρονη τεχνητή νοημοσύνη.

Ο Antoine είναι οραματιστής ηγέτης και ιδρυτικός συνεργάτης της Unite.AI, οδηγούμενος από ένα ακλόνητο πάθος για τη διαμόρφωση και την προώθηση του μέλλοντος της AI και της ρομποτικής. Ως κατά συρροή επιχειρηματίας, πιστεύει ότι η τεχνητή νοημοσύνη θα είναι τόσο ενοχλητική για την κοινωνία όσο και ο ηλεκτρισμός και συχνά πιάνεται να κραυγάζει για τις δυνατότητες των τεχνολογιών και του AGI που προκαλούν αναστάτωση.

Ως μελλοντιστής, είναι αφοσιωμένος στην εξερεύνηση πώς αυτές οι καινοτομίες θα διαμορφώσουν τον κόσμο μας. Επιπλέον, είναι ο ιδρυτής του Securities.io, μια πλατφόρμα που επικεντρώνεται στην επένδυση σε τεχνολογίες αιχμής που επαναπροσδιορίζουν το μέλλον και αναδιαμορφώνουν ολόκληρους τομείς.