Κριτικές βιβλίων
Κριτική Βιβλίου: Η Σκέπτη Μηχανή: Ο Jensen Huang, η NVIDIA και ο Πιο Επιθυμητός Μικροεπεξεργαστής του Κόσμου του Stephen Witt

Η Σκέπτη Μηχανή: Ο Jensen Huang, η NVIDIA και ο Πιο Επιθυμητός Μικροεπεξεργαστής του Κόσμου ξεχωρίζει από τα περισσότερα βιβλία που έχουν γραφτεί για την τεχνητή νοημοσύνη, επειδή προσεγγίζει το θέμα από μια κατεύθυνση που πολλοί τεχνικά ενημερωμένοι αναγνώστες, συμπεριλαμβανομένου και του εαυτού μου, έχουν ιστορικά υποβαθμίσει.
Όπως πολλοί άνθρωποι που έχουν ακολουθήσει την τεχνητή νοημοσύνη για χρόνια, η κατανόησή μου για το πεδίο διαμορφώθηκε από οικείες ορόσημα. Η ιστορία συνήθως αρχίζει το 1956 με το εργαστήριο του Dartmouth, περνά από τα πρώτα συμβολικά συστήματα και στη συνέχεια προχωρά σε ορόσημα όπως η νίκη του Deep Blue εναντίον του Garry Kasparov, η νίκη του DeepMind στο Go και πιο πρόσφατα η δημοσίευση της OpenAI ότι τα μεγάλα μοντέλα γλώσσας μπορούν να συντονίσουν στρατηγική σε σύνθετα περιβάλλοντα πολλαπλών παικτών. Αυτά τα ορόσημα είναι πνευματικά ικανοποιητικά και εύκολα να θυμηθούν, επειδή επικεντρώνονται σε ορατά επιτεύγματα.
Αυτό που το βιβλίο του Stephen Witt κάνει εξαιρετικά καλά είναι να αμφισβητεί αυτή τη στάση. Αντί να επικεντρωθεί σε στιγμές όπου η τεχνητή νοημοσύνη εντυπωσίασε τον κόσμο, Η Σκέπτη Μηχανή επικεντρώθηκε στο λιγότερο ορατό στρώμα κάτω από αυτά τα επιτεύγματα. Υποστηρίζει, πειστικά, ότι η σύγχρονη εποχή της τεχνητής νοημοσύνης δεν απελευθερώθηκε πρωτίστως από έξυπνες ιδέες μόνο, αλλά από μια θεμελιώδη αλλαγή στο πώς η ίδια η υπολογιστική πραγματοποιήθηκε.
Κεντρώνοντας την αφήγηση γύρω από την NVIDIA (NVDA +1.3%) και τον συνιδρυτή της Jensen Huang, ο Witt επαναδιαμορφώνει την επανάσταση της τεχνητής νοημοσύνης ως μια ιστορία για την αρχιτεκτονική υπολογιστών, τις πλατφόρμες αναπτυξιακών και τις μακροχρόνιες πεποιθήσεις. Το αποτέλεσμα δεν είναι απλώς μια εταιρική βιογραφία, αλλά ένα λείπων κεφάλαιο στην ευρύτερη ιστορία της τεχνητής νοημοσύνης.
Από τα Βιντεοπαιχνίδια σε ένα Νέο Παραδείγμα Υπολογιστών
Οι αρχές της NVIDIA είναι μακράν απομακρυσμένες από τις υψηλές φιλοδοξίες που τώρα συνδέονται με την τεχνητή νοημοσύνη. Η εταιρεία εμφανίστηκε το 1993 ως κατασκευαστής chip γραφικών, επικεντρωμένη στην απόδοση ολοένα και πιο ρεαλιστικών κόσμων βιντεοπαιχνιδιών. Η πρόκληση εκείνη την εποχή δεν ήταν η νοημοσύνη, αλλά η ταχύτητα. Τα παιχνίδια απαιτούσαν τεράστιους αριθμούς υπολογισμών να εκτελεστούν άμεσα για να προσομοιώσουν το φως, την κίνηση και το βάθος.
Η λύση που ακολουθούσε η NVIDIA ήταν η παράλληλη υπολογιστική. Η παράλληλη υπολογιστική σημαίνει την εκτέλεση πολλών υπολογισμών ταυτόχρονα αντί να εκτελούνται διαδοχικά. Αντί να βασίζονται σε ένα ισχυρό πυρήνα που επεξεργάζεται μια εντολή μετά την άλλη, οι GPU χρησιμοποιούν χιλιάδες μικρότερους πυρήνες που εργάζονται ταυτόχρονα σε παρόμοιες μαθηματικές λειτουργίες. Αυτή η προσέγγιση είναι ιδιαίτερα ισχυρή για φόρτους εργασίας που περιλαμβάνουν την επανάληψη των ίδιων υπολογισμών σε μεγάλες βάσεις δεδομένων.
Αρχικά, αυτή η αρχιτεκτονική ήταν κατασκευασμένη για γραφικά. Ωστόσο, ο Witt δείχνει πώς αυτή η απόφαση δημιούργησε ήσυχα τις ιδανικές βάσεις για τα νευρωνικά δίκτυα δεκαετίες αργότερα. Η εκπαίδευση των σύγχρονων μοντέλων τεχνητής νοημοσύνης περιλαμβάνει τεράστιους αριθμούς των ίδιων μαθηματικών λειτουργιών που εφαρμόζονται σε τεράστιες ποσότητες δεδομένων. Οι GPU ήταν ήδη βελτιστοποιημένες για ακριβώς αυτό το είδος εργασίας.
Αυτό που κάνει αυτό το μέρος του βιβλίου ελκυστικό είναι το πώς ο Witt συνδέει σαφώς τις τεχνικές σχεδιαστικές επιλογές με την επιβίωση. Η NVIDIA δεν επέλεξε την παράλληλη υπολογιστική επειδή προέβλεψε την τεχνητή νοημοσύνη. Την επέλεξε επειδή ήταν ο seul τρόπος να ανταγωνιστεί σε πραγματικό χρόνο γραφικά. Αυτή η αναγκαιότητα ανάγκασε την εταιρεία να κυριαρχήσει σε ένα υπολογιστικό μοντέλο που θα αποδείχθηκε μετασχηματιστικό πολύ πέρα από τα βιντεοπαιχνίδια.
Ο Jensen Huang και η Σκέψη σε Συστήματα, Όχι Προϊόντα
Στο κέντρο αυτής της ιστορίας είναι ο Jensen Huang, απεικονιζόμενος όχι ως συμβατικός εκτελεστής, αλλά ως κάποιος που συνεχώς σκέφτηκε σε συστήματα και όχι σε ατομικά προϊόντα. Ο Witt παρουσιάζει τον Huang ως απαιτητικό, εντατικό και συχνά δύσκολο, αλλά και εξαιρετικά συνεπή σε αυτό πώς είδε την τεχνολογία σε μακροχρόνιες περιόδους.
Ενώ οι ανταγωνιστές αντιμετώπιζαν τις GPU ως απορρίπτεις συνιστώσες συνδεδεμένες με κύκλους βιντεοπαιχνιδιών, ο Huang τις αντιμετώπισε ως τη βάση μιας ευρύτερης υπολογιστικής πλατφόρμας. Αυτή η διάκριση γίνεται κρίσιμη. Τα προϊόντα αντικαθίστανται. Οι πλατφόρμες συσσωρεύουν.
Εσωτερικά, η NVIDIA αντανακλούσε αυτή τη στάση. Οι μηχανικοί ενθαρρύνθηκαν να σκέφτονται χρόνια μπροστά. Το λογισμικό αντιμετωπίστηκε ως στρατηγικά σημαντικό όσο και το σιλί콘. Οι επενδύσεις έγιναν σε εργαλεία και υποστήριξη αναπτυξιακών πριν ακόμη υπήρχε σαφής ζήτηση. Πολλές από αυτές τις επιλογές φάνηκαν υπερβολικές ή άσκοπες εκείνη την εποχή. Με την αναδρομή, δημιούργησαν ένα χαντί που οι ανταγωνιστές αγωνίζονταν να διασχίσουν.
Ο Witt κάνει σαφές ότι η άνοδος της NVIDIA δεν ήταν αναπόφευκτη. Η εταιρεία ήρθε κοντά στη λήξη περισσότερες από μία φορές. Αυτό που την οδήγησε μπροστά δεν ήταν ένα μόνο σπασίματος, αλλά μια διατηρημένη πίστη ότι η επιταχυνόμενη υπολογιστική θα είχε σημασία τελικά πέρα από την αρχική της χρήση.
CUDA και η Ιστορία Προέλευσης της Τεχνητής Νοημοσύνης που Πολλοί Χάθηκαν
Μια από τις πιο σημαντικές συνεισφορές του Η Σκέπτη Μηχανή είναι το πώς επαναδιαμορφώνει το ρόλο του CUDA στην ιστορία της τεχνητής νοημοσύνης.
Πριν διαβάσετε αυτό το βιβλίο, είναι εύκολο να σκεφτείτε το CUDA ως απλώς ένα επιτυχημένο εργαλείο αναπτυξιακού. Ο Witt δείχνει γιατί αξίζει πολύ περισσότερη προσοχή. Το CUDA δημιουργήθηκε για να κάνει την παράλληλη υπολογιστική χρηστική έξω από τα γραφικά. Πριν από το CUDA, η χρήση των GPU για γενική υπολογιστική απαιτούσε την ανάγκη να αναγκάσει προβλήματα μέσω γραφικών-ειδικών διεπαφών. Αυτό ήταν εύθραυστο, αναποτελεσματικό και περιορισμένο σε ειδικούς.
Το CUDA άλλαξε αυτό, επιτρέποντας στους αναπτυξιακού να προγραμματίζουν τις GPU χρησιμοποιώντας οικεία προγραμματιστικά μοντέλα. Χιλιάδες υπολογιστικοί πυρήνες έγιναν προσβάσιμοι ως γενικός πόρος. Αυτό μειώθηκε το εμπόδιο εισόδου για την υψηλή απόδοση υπολογιστικής με έναν τρόπο που λίγοι άνθρωποι πλήρως εκτίμησαν εκείνη την εποχή.
Αυτό είναι το σημείο όπου το βιβλίο συνήθισε mạnh mẽ με τη δική μου εμπειρία της μάθησης της ιστορίας της τεχνητής νοημοσύνης. Η αφήγηση που απορρόφησα επικεντρώθηκε βαριά σε μοντέλα και αλγορίθμους. Αυτό που Η Σκέπτη Μηχανή κάνει σαφές είναι ότι πολλές από αυτές τις ιδέες έγιναν πρακτικές μόνο όταν οι ερευνητές μπορούσαν να τις εκπαιδεύσουν σε κλίμακα.
Οι ερευνητές της τεχνητής νοημοσύνης αναγνώρισαν γρήγορα ότι τα νευρωνικά δίκτυα ήταν μια σχεδόν τέλεια αντιστοιχία για την παράλληλη υπολογιστική. Η εκπαίδευση περιλαμβάνει την επανάληψη των ίδιων λειτουργιών σε μεγάλες βάσεις δεδομένων, προσαρμόζοντας εκατομμύρια ή δισεκατομμύρια παραμέτρων με την πάροδο του χρόνου. Το CUDA επέτρεψε αυτή τη διαδικασία να συμβεί γρηγορότερα, φθηνότερα και πιο αξιόπιστα από ότι θα μπορούσαν οι CPU.
Αυτό έγινε ιδιαίτερα σημαντικό καθώς η βαθιά μάθηση επιταχύνθηκε και αργότερα καθώς τα μοντέλα με βάση τους μετασχηματισμούς εμφανίστηκαν. Τα μοντέλα μετασχηματισμού ευδοκιμούν στην κλίμακα. Χωρίς την επιτάχυνση της GPU, πολλά από τα μοντέλα που ορίζουν το σημερινό τοπίο της τεχνητής νοημοσύνης θα είχαν παραμείνει θεωρητικά ή απαγορευτικά ακριβά. Το CUDA δεν εφηύρε αυτές τις αρχιτεκτονικές, αλλά έκανε τη γρήγορη εξέλιξή τους δυνατή.
Αυτό που ο Witt καταγράφει ιδιαίτερα καλά είναι ότι αυτό το αποτέλεσμα δεν ήταν πλήρως σχεδιασμένο. Το CUDA κατασκευάστηκε για την επιστημονική υπολογιστική. Οι ερευνητές της τεχνητής νοημοσύνης ανακάλυψαν τη δύναμή του και έτσαν την NVIDIA στο κέντρο του αγώνα της τεχνητής νοημοσύνης.
Υποδομή Υπερ των Αλγορίθμων
Μια από τις πιο πολύτιμες εντυπώσεις του βιβλίου είναι ότι η πρόοδος της τεχνητής νοημοσύνης περιορίζεται όσο από την υποδομή όσο και από τις ιδέες. Πολλές δημοφιλείς αφηγήσεις επικεντρώνονται στους αλγορίθμους, τις τεχνικές εκπαίδευσης και τις βάσεις δεδομένων. Η Σκέπτη Μηχανή υπενθυμίζει στον αναγνώστη ότι κανένα από αυτά δεν έχει σημασία χωρίς επαρκής υπολογιστική ισχύ.
Από αυτή την προοπτική, η σύγχρονη έκρηξη της τεχνητής νοημοσύνης φαίνεται λιγότερο ξαφνική και πιο καθυστερημένη. Τα νευρωνικά δίκτυα υπήρχαν για δεκαετίες. Αυτό που άλλαξε ήταν η διαθεσιμότητα του υλικού ικανό να τα εκπαιδεύσει σε σημαντική κλίμακα.
Η NVIDIA δεν παρείχε απλώς ταχύτερα chip. Κατασκεύασε ένα οικοσύστημα από υλικό, βιβλιοθήκες λογισμικού και εργαλεία αναπτυξιακού που ενίσχυαν ο ένας τον άλλον με την πάροδο του χρόνου. Όσο οι ερευνητές βελτίωναν το έργο τους για τις πλατφόρμες της NVIDIA, η NVIDIA βελτίωνε τα προϊόντα της για να εξυπηρετήσει καλύτερα τις φόρτους εργασίας της τεχνητής νοημοσύνης. Αυτή η ανάδραση δημιούργησε ένα ανταγωνιστικό πλεονέκτημα που επεκτάθηκε πολύ πέρα από την خامμη απόδοση.
Το βιβλίο υπογραμμίζει ήσυχα μια πραγματικότητα που γίνεται ολοένα και πιο φανερή σήμερα: η ηγεσία στην τεχνητή νοημοσύνη διαμορφώνεται από αλυσίδες εφοδιασμού, ικανότητα παραγωγής, οικοσυστήματα λογισμικού και έλεγχο πλατφόρμας, όχι μόνο ερευνητική ευφυΐα.
Όραμα, Ρίσκο και Συσσωρευμένες Συνέπειες
Ο Witt δεν φοβάται να αντιμετωπίσει τις επιπτώσεις της κυριαρχίας της NVIDIA. Όσο η εταιρεία γίνεται θεμελιώδης για την παγκόσμια υποδομή της τεχνητής νοημοσύνης, η επιρροή της αυξάνεται αντίστοιχα. Η πίστη του Jensen Huang ότι η επιταχυνόμενη υπολογιστική θα ορίσει την επόμενη φάση της τεχνολογικής προόδου διατρέχει όλο το βιβλίο.
Αντί να ηθικολογεί, Η Σκέπτη Μηχανή επικεντρώθηκε σε πώς οι συνεχείς μηχανικές και στρατηγικές αποφάσεις συσσωρεύθηκαν με την πάροδο του χρόνου. Η NVIDIA δεν κέρδισε ακολουθώντας τις τάσεις. Κέρδισε επειδή δεσμεύτηκε νωρίς στην παράλληλη υπολογιστική, αντέχοντας σε επαναλαμβανόμενους κύκλους αγοράς και επενδύοντας αμείωτα στα εργαλεία που έκαναν το υλικό της απαραίτητο.
Για τους Αναγνώστες που Θέλουν να Κατανοήσουν Πώς η Τεχνητή Νοημοσύνη Κλιμάκωσε Πραγματικά
Για τους αναγνώστες που ήδη γνωρίζουν τα ορόσημα της ιστορίας της τεχνητής νοημοσύνης, αυτό το βιβλίο γεμίζει το λείπων στρώμα κάτω από αυτά. Εξηγεί γιατί αυτά τα ορόσημα μπορούσαν να κλιμακωθούν όταν το έκαναν, και γιατί η NVIDIA εμφανίστηκε ως μια τόσο κεντρική δύναμη στη διαδικασία.
Αυτό είναι ένα βιβλίο για τους αναγνώστες που θέλουν να κατανοήσουν την τεχνητή νοημοσύνη ως βιομηχανικό σύστημα και όχι ως συλλογή έξυπνων μοντέλων. Θα συνειδητοποιήσει ισχυρά με εκείνους που ενδιαφέρονται για τα chip, τα κέντρα δεδομένων και τις συχνά αόρατες μηχανικές αποφάσεις που σιωπηλά διαμορφώνουν την τεχνολογική δύναμη.
Η Σκέπτη Μηχανή επιτυγχάνει επειδή επαναδιαμορφώνει την ιστορία της τεχνητής νοημοσύνης από το έδαφος, δείχνοντας πώς η παράλληλη υπολογιστική, οι πλατφόρμες αναπτυξιακού και η μακροχρόνια όραση χτίσανε τις βάσεις στις οποίες η σύγχρονη τεχνητή νοημοσύνη στέκεται τώρα.












