Connect with us

Η Υποδομή Της Τεχνητής Νοημοσύνης Είναι Κατεστραμμένη. Τα Tokens Γίνονται Το Νέο Μέτρο Αξίας.

Ηγέτες σκέψης

Η Υποδομή Της Τεχνητής Νοημοσύνης Είναι Κατεστραμμένη. Τα Tokens Γίνονται Το Νέο Μέτρο Αξίας.

mm

Η βιομηχανία της τεχνητής νοημοσύνης έχει ένα πρόβλημα μέτρησης.

Για χρόνια, η επιτυχία ορίστηκε από την πρόσβαση σε υπολογιστικές πόρους, όπως ποιος έχει τους περισσότερους GPU, τις μεγαλύτερες κλίκες ή τις ταχύτερες εκτελέσεις. Δισεκατομμύρια έχουν διατεθεί για υποδομή για να κερδίσουν αυτό το αγώνα.

Αλλά καθώς η τεχνητή νοημοσύνη περνά από την πειραματική φάση στην παραγωγή, αυτό το μοντέλο αρχίζει να καταρρέει.

Οι επιχειρήσεις δεν αγοράζουν GPU. Δεν αγοράζουν ούτε καν ικανότητα συλλογής. Αγοράζουν αποτελέσματα όπως περίληψη, συστάσεις, αποφάσεις, περιεχόμενο. Με άλλα λόγια, αγοράζουν tokens.

Ωστόσο, η περισσότερη υποδομή της τεχνητής νοημοσύνης vẫn σχεδιάζεται ως если ο υπολογισμός ήταν ο τελικός στόχος. Δεν είναι.

Η πραγματική μονάδα αξίας στην τεχνητή νοημοσύνη είναι το token. Και οι εταιρείες που αναγνωρίζουν αυτή τη μετατόπιση νωρίς θα ορίσουν την επόμενη εποχή της αγοράς.

Η άνοδος του εργοστασίου token της τεχνητής νοημοσύνης

Εάν τα tokens είναι το προϊόν, τότε η υποδομή της τεχνητής νοημοσύνης πρέπει να συμπεριφέρεται σαν ένα σύστημα παραγωγής, όχι σαν ένα ερευνητικό έργο. Αυτό είναι όπου έρχεται η έννοια του εργοστασίου token της τεχνητής νοημοσύνης.

Ένα εργοστάσιο token της τεχνητής νοημοσύνης δεν είναι απλά ένα επιπλέον λογισμικό στρώμα στο στάκ. Είναι μια ανασκόπηση του στάκ selbst. Αντί να βελτιστοποιεί για απομονωμένη απόδοση μοντέλου ή сырой αξιοποίηση υλικού, εστιάζει σε ένα αποτέλεσμα: αποτελεσματική παραγωγή token σε κλίμακα.

Σημαίνει αφαίρεση της复雑ότητας της υποδομής, δυναμική ανάθεση φόρτου εργασίας σε ετερογενείς περιβάλλοντα και συνεχής βελτιστοποίηση για απόδοση, καθυστέρηση, αξιοποίηση και κόστος ανά token.

Το σημερινό μοντέλο είναι ουσιαστικά ενοικίαση GPU με επιπλέον βήματα. Οι οργανισμοί προβλέπουν ακριβή υλικό, συνθέτουν κατακερματισμένα εργαλεία και ελπίζουν ότι η αξιοποίηση θα δικαιολογήσει τελικά την επένδυση.

Ένα εργοστάσιο token ανατρέπει αυτή τη σχέση. Παρέχει εξόδους, όχι υποδομή, και αντιμετωπίζει την αποτελεσματικότητα ως τον πυρήνα αρχιτεκτονικής από την πρώτη μέρα. Αυτό δεν είναι προοδευτική πρόοδος. Είναι μια μετατόπιση από την υποδομή ως ικανότητα στην υποδομή ως παραγωγή.

Γιατί το παλιό μοντέλο δεν μπορεί να διατηρηθεί

Το τρέχον μοντέλο υποδομής της τεχνητής νοημοσύνης δεν είναι μόνο αναποτελεσματικό. Είναι ολοένα και πιο αβέβαιο.

Η έλλειψη GPU αποκάλυψε τις πρώτες ρωγμές. Η ζήτηση συνεχίζει να ξεπερνά την προσφορά,迫使 τις οργανώσεις σε κατακερματισμένες, πολυ-πωλητές αναπτύξεις. Αυτό που ξεκίνησε ως προσωρινό εργατικό έγινε γρήγορα το κανονικό: ετερογενή περιβάλλοντα που συνδέονται χωρίς einen ενοποιημένο επιχειρησιακό στρώμα.

Το πρόβλημα είναι ότι οι περισσότερες υπάρχουσες στοίβες δεν χτίστηκαν για αυτή τη πραγματικότητα. Δεν βελτιστοποιούν αποτελεσματικά σε διαφορετικές αρχιτεκτονικές, δεν προσαρμόζονται σε πραγματικό χρόνο ή δεν παρέχουν σαφή ορατότητα στην απόδοση και το κόστος.

Ως αποτέλεσμα, η复雑ότητα αυξάνεται γρηγορότερα από την κλίμακα.

Κάθε νέο μοντέλο, πλαίσιο, επιταχυντής ή cloud πλατφόρμα εισάγει ένα επιπλέον στρώμα λειτουργικής复雑ότητας. Οι ομάδες ξοδεύουν τεράστιες ποσότητες χρόνου διαχειρίζοντας ορχήστρα, συμβατότητα, δρομολόγηση, προγραμματισμό και παρακολούθηση ζητημάτων αντί να βελτιστοποιούν τα αποτελέσματα.

Τι πρέπει να είναι ένα πλεονέκτημα κλίμακας γρήγορα γίνεται ένα πρόβλημα συντονισμού.

Ταυτόχρονα, η οικονομία γίνεται ολοένα και πιο δύσκολη να αγνοηθεί. Οι πρώτες αναπτύξεις της τεχνητής νοημοσύνης μπορούσαν να κρύψουν τις αναποτελεσματικότητες πίσω από την ανάπτυξη και την πειραματική φάση. Αυτό το παράθυρο κλείνει.

Οι διευθυντές ζητούν τώρα πιο δύσκολα ερωτήματα: Γιατί το κόστος της συλλογής είναι τόσο απρόβλεπτο; Γιατί η αξιοποίηση του GPU είναι ακόμη τόσο χαμηλή; Γιατί οι οργανισμοί πληρώνουν premium τιμές για υλικό που συχνά κάθεται αδρανές; Γιατί είναι τόσο δύσκολο να συνδέσει την υποδομή με τα επιχειρηματικά αποτελέσματα;

Η απάντηση είναι απλή: Το σύστημα σχεδιάστηκε για πρόσβαση, όχι για αποτελεσματικότητα.

Από υπολογιστική κεντρική αρχιτεκτονική σε αρχιτεκτονική κεντρική token

Η μετατόπιση προς τα εργοστάσια token είναι και φιλοσοφική και αρχιτεκτονική.

Πρώτον, η αγορά μετατοπίζεται από την υπηρεσία GPU στην υπηρεσία αποτελέσματος. Οι πελάτες δεν θέλουν να διαχειρίζονται υποδομή, θέλουν εγγυημένα αποτελέσματα. Το λογικό τελικό σημείο είναι η κατανάλωση με βάση τις εξόδους, όχι τους πόρους.

Δεύτερον, οι κατακερματισμένες στοίβες δίνουν τη θέση τους σε ενοποιημένα στρώματα ελέγχου. Σε ένα ετερογενές περιβάλλον, η ορατότητα και ο έλεγχος είναι όλα. Τα εργοστάσια token παρέχουν πραγματική ορατότητα στην χρήση, το κόστος και την απόδοση, και την ικανότητα να ενεργήσουν πάνω σε αυτό. Οι οργανισμοί πρέπει να κατανοήσουν: Ποιος παράγει tokens; Σε ποιο κόστος; Σε ποιο υλικό; Υπό ποιο φόρτο εργασίας; Και με ποιο επίπεδο αποτελεσματικότητας; Χωρίς αυτές τις απαντήσεις, η βελτιστοποίηση γίνεται τυχαία.

Τέλος, η εστίαση της βιομηχανίας μετατοπίζεται από την εκτέλεση στην συνεχής βελτιστοποίηση. Η πρόκληση δεν είναι πλέον απλά η εκτέλεση μοντέλων, αλλά η εκτέλεση τους με νοημοσύνη, καθώς οι οργανισμοί καθορίζουν: Ποιος φόρτος εργασίας ανήκει σε ποιο υλικό; Πώς να μεγιστοποιήσετε την απόδοση ενώ ελέγχετε το κόστος; Πώς να προλαμβάνετε την απώλεια token;

Τα εργοστάσια token αντιμετωπίζουν αυτά τα ερωτήματα ως πρώτου βαθμού προβλήματα, όχι ως δεύτερου βαθμού.

Γιατί το σημερινό μοντέλο παράδοσης της τεχνητής νοημοσύνης δεν επαρκεί

Η παραδοσιακή στοίβα της τεχνητής νοημοσύνης (που περιλαμβάνει προμηθευτές υλικού, cloud πλατφόρμες, υπηρεσίες συλλογής) χτίστηκε κυρίως για γρήγορη ανάπτυξη, όχι για συστημική αποτελεσματικότητα.

Κάθε στρώμα προσθέτει αξία αλλά και κόστος, αφαίρεση και λειτουργική κατακερματισμός. Το αποτέλεσμα είναι ένα σύστημα με στοίβες περιθώρια, περιορισμένη διαφάνεια και αυξανόμενο κλείδωμα προμηθευτή. Οι οργανισμοί τελικά βελτιστοποιούν μέσα σε σιλό αντί για σε όλο το σύστημα.

Τα εργοστάσια token προκύπτουν фундамεντάλmente αυτό το μοντέλο.

Αποσυνδέοντας το υλικό από την παράδοση αξίας, ενεργοποιούν την ολοκληρωμένη βελτιστοποίηση. Οι φόρτοι εργασίας μπορούν να κινηθούν εύκολα σε διαφορετικά περιβάλλοντα. Οι αρχιτεκτονικές μπορούν να εξελιχθούν χωρίς να απαιτούν τεράστιες αναγραφές. Η αποτελεσματικότητα γίνεται μετρήσιμη, διαχειρίσιμη και συνεχώς βελτιστοποιήσιμη.

Αυτό είναι το πώς οι επιχειρήσεις και οι νεο-cloud μπορούν να ανταγωνιστούν πιο αποτελεσματικά με τους υπερ-σκαλαρείς. Όχι με το να ταιριάζουν την κλίμακα, αλλά με το να υπερβαίνουν την αποτελεσματικότητα.

Ποιος θα κερδίσει

Πιθανότατα το πιο διαταρακτικό аспект αυτής της μετάβασης είναι ποιος την ενδυναμώνει. Δεν χρειάζεται να拥有 ένα κέντρο δεδομένων ή ακόμη και GPU για να λειτουργήσετε ένα εργοστάσιο token.

Τι που έχει σημασία είναι ο έλεγχος της ορχήστρας, της βελτιστοποίησης και της παράδοσης. Αυτό ανοίγει την πόρτα σε ένα πολύ ευρύτερο σύνολο παικτών:

  • Επιχειρήσεις με μεγάλους, μόνιμους φόρτους εργασίας της τεχνητής νοημοσύνης.
  • Νεο-πρωταγωνιστές που βελτιστοποιούν για συγκεκριμένες καταертиές ή περιπτώσεις χρήσης.
  • Προμηθευτές υποδομής που μετακινούνται πάνω στο στάκ.

Σε αυτό το μοντέλο, το ανταγωνιστικό πλεονέκτημα δεν έρχεται από την κράτηση υπολογισμού. Ερχεται από την παραγωγή token καλύτερα, γρηγορότερα και φθηνότερα από οποιονδήποτε άλλον.

Το νέο πεδίο μάχης: Κόστος ανά token

Η επόμενη φάση της ανταγωνιστικότητας της τεχνητής νοημοσύνης δεν θα κερδηθεί μόνο με την ποιότητα του μοντέλου. Θα κερδηθεί με την αποτελεσματικότητα. Πιο συγκεκριμένα, το κόστος ανά token.

Ποιος μπορεί να παραδώσει ισοδύναμα ή καλύτερα αποτελέσματα με μια κλάσμα του κόστους; Ποιος μπορεί να κλιμακωθεί χωρίς να ξεφύγει η υποδομή; Ποιος μπορεί να μετατρέψει την τεχνητή νοημοσύνη σε một προβλέψιμη, κερδοφόρα επιχείρηση;

Αυτά δεν είναι ερωτήματα υποδομής. Είναι ερωτήματα παραγωγής που απαιτούν μια παραγωγική νοοτροπία.

Το μέλλον δεν χτίζεται σε GPU

Τα GPU δεν εξαφανίζονται, αλλά δεν είναι πλέον η ιστορία. Τα tokens είναι.

Οι οργανισμοί που παραμένουν εστιασμένοι στην υπολογιστική αντιμετωπίζουν αυξανόμενα κόστη και μειούμενη απόδοση. Αυτοί που μετατοπίζονται σε συστήματα κεντρικής token θα ξεκλειδώνουν ένα фундамεντάλ διαφορετικό μοντέλο, ένα που ευθυγραμμίζει την υποδομή με τα αποτελέσματα και το κόστος με την αξία.

Τα εργοστάσια token της τεχνητής νοημοσύνης δεν είναι μια μακρινή έννοια. Είναι μια αναπόφευκτη εξέλιξη της αγοράς. Το μόνο πραγματικό ερώτημα είναι ποιος θα τα χτίσει πρώτος και ποιος θα μείνει πίσω.

Γκαούραβ Σάχ είναι Αντιπρόεδρος Ανάπτυξης Επιχειρήσεων και Στρατηγικής στην NeuReality, όπου ηγείται των προσπαθειών των πελατών για να επαναφέρουν την έμφαση στην τεχνητή νοημοσύνη και να επιταχύνουν την υιοθέτησή της σε τομείς όπως οι финτεχ, η υγεία και η κυβέρνηση. Ο Γκαούραβ έχει τριών δεκαετιών εμπειρία στη βιομηχανία της τεχνολογίας, εργαζόμενος σε ρόλους μάρκετινγκ και διαχείρισης προϊόντων στην NVIDIA, Marvell, Tenstorrent και GlobalFoundries. Βρίσκεται στην περιοχή του Κόλπου του Σαν Φρανσίσκο.