Συνδεθείτε μαζί μας

Google Cloud Next 2025: Διπλασιασμός της τεχνητής νοημοσύνης με πυρίτιο, λογισμικό και οικοσύστημα Open Agent

Ανακοινώσεις

Google Cloud Next 2025: Διπλασιασμός της τεχνητής νοημοσύνης με πυρίτιο, λογισμικό και οικοσύστημα Open Agent

mm

Το Λας Βέγκας φιλοξενεί Google Cloud Next 2025, ένα γεγονός που εκτυλίσσεται σε μια κρίσιμη στιγμή για τον κλάδο της τεχνολογίας. Η τεχνητή νοημοσύνη κούρσα εξοπλισμών μεταξύ των τιτάνων σύννεφων – Amazon Web Services (AWS), Microsoft Azure και Google Cloud – κλιμακώνεται με ταχείς ρυθμούς. Η Google, που συχνά εμφανίζεται ως ο τρίτος υποψήφιος παρά την τρομερή τεχνολογική της ικανότητα και τις βαθιές ερευνητικές ρίζες της τεχνητής νοημοσύνης, άρπαξε το στάδιο Cloud Next για να αρθρώσει μια ολοκληρωμένη και επιθετική στρατηγική που στοχεύει ακριβώς στην αγορά της επιχειρηματικής τεχνητής νοημοσύνης.

Η αφήγηση, που παραδόθηκε από τον Διευθύνοντα Σύμβουλο του Google Cloud, Thomas Kurian και απηχήθηκε από τον CEO της Google και της Alphabet, Sundar Pichai, επικεντρώθηκε στη μετατροπή του μετασχηματισμού της τεχνητής νοημοσύνης από την απλή δυνατότητα στην απτή πραγματικότητα. Η Google υπογράμμισε τη διεκδικούμενη δυναμική της, αναφέροντας πάνω από 3,000 βελτιώσεις προϊόντων το περασμένο έτος, μια εικοσαπλάσια αύξηση Vertex AI πλατφόρμα χρήση από την προηγούμενη εκδήλωση Cloud Next, περισσότεροι από τέσσερα εκατομμύρια προγραμματιστές χτίζουν ενεργά με αυτό Οικογένεια μοντέλων Διδύμων, και παρουσιάζοντας περισσότερες από 500 ιστορίες επιτυχίας πελατών κατά τη διάρκεια του συνεδρίου.

Ωστόσο, το Google Cloud Next 2025 ήταν κάτι περισσότερο από μια βιτρίνα σταδιακών ενημερώσεων ή εντυπωσιακών μετρήσεων. Αποκάλυψε επίσης μια πολύπλευρη επίθεση. Με την κυκλοφορία ισχυρού, προσαρμοσμένου πυριτίου βελτιστοποιημένου συμπερασμάτων (το Ironwood TPU), βελτιώνοντας το χαρτοφυλάκιο μοντέλων της ναυαρχίδας AI με έμφαση στην πρακτικότητα (Gemini 2.5 Flash), ανοίγοντας την τεράστια παγκόσμια υποδομή δικτύου του στις επιχειρήσεις (Cloud WAN), και κάνοντας ένα σημαντικό, στρατηγικό στοίχημα σε ένα ανοιχτό, διαλειτουργικό οικοσύστημα για πράκτορες τεχνητής νοημοσύνης (το πρωτόκολλο Agent2Agent), η Google τοποθετείται επιθετικά για να καθορίσει την επόμενη εξελικτική φάση της επιχειρηματικής τεχνητής νοημοσύνης – αυτό που η εταιρεία αποκαλεί όλο και περισσότερο ως «πρακτορική εποχή. "

Εναρκτήρια ομιλία για το Google Cloud Next 25: Ο νέος τρόπος για να αξιοποιήσετε στο έπακρο το cloud

Ironwood, Gemini, and the Network Effect

Κεντρική θέση στις φιλοδοξίες AI της Google είναι η συνεχής επένδυσή της σε προσαρμοσμένο πυρίτιο. Το αστέρι του Cloud Next 2025 ήταν το Ironwood, η έβδομη γενιά της μονάδας επεξεργασίας τανυστή (TPU) της Google. Κρίσιμα, το Ironwood παρουσιάζεται ως το πρώτο TPU που έχει σχεδιαστεί ρητά AI συμπέρασμα – η διαδικασία χρήσης εκπαιδευμένων μοντέλων για την πραγματοποίηση προβλέψεων ή τη δημιουργία αποτελεσμάτων σε εφαρμογές πραγματικού κόσμου. 

Οι ισχυρισμοί απόδοσης για το Ironwood είναι σημαντικοί. Η Google λεπτομερείς διαμορφώσεις που κλιμακώνονται σε τεράστια 9,216 υγρόψυκτα τσιπ διασυνδεδεμένα σε ένα μόνο pod. Αυτή η μεγαλύτερη διαμόρφωση φέρεται να παρέχει ένα εκπληκτικό 42.5 exaflops υπολογιστικής ισχύος. Η Google ισχυρίζεται ότι αυτό αντιπροσωπεύει περισσότερο από 24 φορές την υπολογιστική ισχύ ανά pod El Capitan, αυτή τη στιγμή κατατάσσεται ως ο ισχυρότερος υπερυπολογιστής στον κόσμο.

Αν και είναι εντυπωσιακές, είναι σημαντικό να σημειωθεί ότι τέτοιες συγκρίσεις συχνά περιλαμβάνουν διαφορετικά επίπεδα αριθμητικής ακρίβειας, καθιστώντας την άμεση ισοδυναμία πολύπλοκη. Ωστόσο, η Google τοποθετεί το Ironwood ως μεγαλύτερη από δεκαπλάσια βελτίωση σε σχέση με την προηγούμενη γενιά TPU υψηλής απόδοσης.

Πέρα από τον ακατέργαστο υπολογισμό, το Ironwood μπορεί να υπερηφανεύεται για σημαντικές προόδους στη μνήμη και τη διασυνδεσιμότητα σε σύγκριση με τον προκάτοχό του, το Trillium (TPU v6).

Ίσως εξίσου σημαντική είναι η έμφαση στην ενεργειακή απόδοση. Η Google ισχυρίζεται ότι το Ironwood προσφέρει διπλάσια απόδοση ανά watt σε σύγκριση με το Trillium και είναι σχεδόν 30 φορές πιο αποδοτικό σε σχέση με την πρώτη του Cloud TPU από το 2018. Αυτό αντιμετωπίζει άμεσα τον αυξανόμενο περιορισμό της διαθεσιμότητας ισχύος στα κέντρα δεδομένων κλιμάκωσης για τεχνητή νοημοσύνη.

Σύγκριση γενιάς Google TPU: Ironwood (v7) έναντι Trillium (v6)

Χαρακτηριστικό Trillium (TPU v6) Ironwood (TPU v7) Συντελεστής Βελτίωσης
Πρωταρχική εστίαση Εκπαίδευση & Συμπεράσματα Συμπέρασμα Ειδίκευση
Υπολογισμός αιχμής/τσιπ Μη άμεσα συγκρίσιμο (διαφορά γενεάς) 4,614 TFLOP (πιθανό FP8) -
Χωρητικότητα/τσιπ HBM 32 GB (εκτιμάται βάσει 6x αξίωσης) 192 GB 6x
Εύρος ζώνης HBM/Chip ~1.6 Tbps (εκτιμάται με βάση 4.5x) 7.2 tbps 4.5x
Εύρος ζώνης ICI (bidir.) ~0.8 Tbps (εκτιμάται με βάση 1.5x) 1.2 tbps 1.5x
Perf/Watt vs. Prev Gen Βασική γραμμή για σύγκριση 2x vs Trillium 2x
Perf/Watt εναντίον TPU v1 (2018) ~15x (εκτιμώμενο) Σχεδόν 30x ~ 2x εναντίον Trillium


Σημείωση: Ορισμένα στοιχεία του Trillium εκτιμώνται με βάση τους ισχυριζόμενους παράγοντες βελτίωσης της Google για το Ironwood. Η υπολογιστική σύγκριση αιχμής είναι πολύπλοκη λόγω διαφορών γενεών και πιθανών διακυμάνσεων ακρίβειας.

Το Ironwood αποτελεί βασικό μέρος της ιδέας «AI Υπερυπολογιστής» της Google – μια αρχιτεκτονική που ενσωματώνει βελτιστοποιημένο υλικό (συμπεριλαμβανομένων των TPU και GPU όπως π. Το Blackwell της Nvidia και επερχόμενος Βέρα Ρούμπιν), λογισμικό (όπως το Pathways κατανεμημένο χρόνο εκτέλεσης ML), αποθήκευση (Hyperdisk Exapools, Managed Lustre) και δικτύωση για την αντιμετώπιση απαιτητικών φόρτων εργασίας AI.

Στο μέτωπο των μοντέλων, η Google παρουσίασε το Gemini 2.5 Flash, μια στρατηγική αντίστιξη στο high-end Gemini 2.5 Pro. Ενώ το Pro στοχεύει στη μέγιστη ποιότητα για πολύπλοκη λογική, το Flash είναι ρητά βελτιστοποιημένο για χαμηλό λανθάνοντα χρόνο και αποδοτικότητα κόστους, καθιστώντας το κατάλληλο για εφαρμογές μεγάλου όγκου, σε πραγματικό χρόνο, όπως αλληλεπιδράσεις εξυπηρέτησης πελατών ή γρήγορη σύνοψη.

Το Gemini 2.5 Flash διαθέτει έναν δυναμικό «προϋπολογισμό σκέψης» που προσαρμόζει την επεξεργασία με βάση την πολυπλοκότητα των ερωτημάτων, επιτρέποντας στους χρήστες να συντονίζουν την ισορροπία μεταξύ ταχύτητας, κόστους και ακρίβειας. Αυτή η ταυτόχρονη εστίαση σε ένα τσιπ συμπερασμάτων υψηλής απόδοσης (Ironwood) και ένα μοντέλο βελτιστοποιημένου κόστους/λανθάνουσας κατάστασης (Gemini Flash) υπογραμμίζει την ώθηση της Google προς την πρακτική λειτουργικοποίηση της τεχνητής νοημοσύνης, αναγνωρίζοντας ότι το κόστος και η αποτελεσματικότητα των μοντέλων που λειτουργούν στην παραγωγή αποτελούν πρωταρχικό μέλημα για τις επιχειρήσεις.

Συμπληρώνοντας τις ενημερώσεις πυριτίου και μοντέλων είναι η κυκλοφορία του Cloud WAN. Η Google παράγει αποτελεσματικά το τεράστιο εσωτερικό της παγκόσμιο δίκτυο – που εκτείνεται σε πάνω από δύο εκατομμύρια μίλια οπτικών ινών, συνδέοντας 42 περιοχές μέσω περισσότερων από 200 σημείων παρουσίας – καθιστώντας το άμεσα διαθέσιμο σε εταιρικούς πελάτες. 

Η Google ισχυρίζεται ότι αυτή η υπηρεσία μπορεί να προσφέρει έως και 40% ταχύτερη απόδοση σε σύγκριση με το δημόσιο διαδίκτυο και να μειώσει το συνολικό κόστος ιδιοκτησίας έως και 40% σε σύγκριση με τα αυτοδιαχειριζόμενα WAN, που υποστηρίζονται από SLA αξιοπιστίας 99.99%. Στοχεύοντας κυρίως σε συνδεσιμότητα υψηλής απόδοσης μεταξύ κέντρων δεδομένων και συνδεόμενων περιβαλλόντων υποκαταστημάτων/πανεπιστημιούπολης, το Cloud WAN αξιοποιεί την υπάρχουσα υποδομή της Google, συμπεριλαμβανομένου του Κέντρου Συνδεσιμότητας Δικτύου. 

Ενώ η Google ανέφερε τη Nestlé και την Citadel Securities ως πρώιμους χρήστες, αυτή η κίνηση ουσιαστικά οπλίζει ένα βασικό στοιχείο υποδομής. Μετατρέπει μια εσωτερική λειτουργική αναγκαιότητα σε ανταγωνιστικό παράγοντα διαφοροποίησης και πιθανή ροή εσόδων, αμφισβητώντας άμεσα τόσο τους παραδοσιακούς παρόχους τηλεπικοινωνιών όσο και τις προσφορές δικτύωσης ανταγωνιστικών πλατφορμών cloud όπως το AWS Cloud WAN και το Azure Virtual WAN.

(Πηγή: Google DeepMind)

The Agent Offensive: Χτίζοντας Γέφυρες με ADK και A2A

Πέρα από την υποδομή και τα βασικά μοντέλα, το Google Cloud Next 2025 έδωσε εξαιρετική έμφαση στο Πράκτορες AI και τα εργαλεία για την κατασκευή και τη σύνδεσή τους. Το όραμα που παρουσιάζεται εκτείνεται πολύ πέρα ​​από τα απλά chatbots, οραματιζόμενοι εξελιγμένα συστήματα ικανά για αυτόνομη συλλογιστική, σχεδιασμό και εκτέλεση σύνθετων εργασιών πολλαπλών βημάτων. Η εστίαση σαφώς μετατοπίζεται προς την ενεργοποίηση συστήματα πολλαπλών πρακτόρων, όπου εξειδικευμένοι πράκτορες συνεργάζονται για την επίτευξη ευρύτερων στόχων.

Για να διευκολύνει αυτό το όραμα, η Google εισήγαγε το Agent Development Kit (ADK). Το ADK είναι ένα πλαίσιο ανοιχτού κώδικα, αρχικά διαθέσιμο στην Python, σχεδιασμένο για να απλοποιεί τη δημιουργία μεμονωμένων πρακτόρων και πολύπλοκων συστημάτων πολλαπλών πρακτόρων. Η Google ισχυρίζεται ότι οι προγραμματιστές μπορούν να δημιουργήσουν έναν λειτουργικό παράγοντα με λιγότερο από 100 γραμμές κώδικα. 

Τα βασικά χαρακτηριστικά περιλαμβάνουν μια προσέγγιση με πρώτο κώδικα για ακριβή έλεγχο, εγγενή υποστήριξη για αρχιτεκτονικές πολλαπλών παραγόντων, ευέλικτη ενοποίηση εργαλείων (συμπεριλαμβανομένης της υποστήριξης για Πρωτόκολλο πλαισίου μοντέλου, ή MCP), ενσωματωμένες δυνατότητες αξιολόγησης και επιλογές ανάπτυξης που κυμαίνονται από τοπικά κοντέινερ έως το διαχειριζόμενο Vertex AI Agent Engine. Το ADK υποστηρίζει επίσης μοναδικά αμφίδρομη ροή ήχου και βίντεο για πιο φυσικές, ανθρώπινες αλληλεπιδράσεις. Ένα συνοδευτικό "Agent Garden" παρέχει έτοιμα προς χρήση δείγματα και πάνω από 100 προκατασκευασμένες υποδοχές για την εκκίνηση της ανάπτυξης.

Το πραγματικό επίκεντρο της στρατηγικής αντιπροσώπων της Google, ωστόσο, είναι το Agent2Agent (A2A) πρωτόκολλο. Το A2A είναι ένα νέο, ανοίξτε πρότυπο σχεδιασμένο ρητά για τη διαλειτουργικότητα πρακτόρων. Ο θεμελιώδης στόχος του είναι να επιτρέψει στους πράκτορες AI, ανεξάρτητα από το πλαίσιο με το οποίο κατασκευάστηκαν (ADK, LangGraph, CrewAI, κ.λπ.) ή τον προμηθευτή που τους δημιούργησε, να επικοινωνούν με ασφάλεια, να ανταλλάσσουν πληροφορίες και να συντονίζουν ενέργειες. Αυτό αντιμετωπίζει άμεσα τη σημαντική πρόκληση των συστημάτων τεχνητής νοημοσύνης με σιωπή μέσα στις επιχειρήσεις, όπου οι πράκτορες που έχουν δημιουργηθεί για διαφορετικά καθήκοντα ή τμήματα συχνά δεν μπορούν να αλληλεπιδράσουν.

Αυτή η ώθηση για ένα ανοιχτό πρωτόκολλο A2A αντιπροσωπεύει ένα σημαντικό στρατηγικό στοίχημα. Αντί να δημιουργήσει ένα ιδιόκτητο, κλειστό οικοσύστημα πρακτόρων, η Google προσπαθεί να καθιερώσει το de facto πρότυπο για την επικοινωνία πρακτόρων. Αυτή η προσέγγιση δυνητικά θυσιάζει το βραχυπρόθεσμο κλείδωμα για την προοπτική της μακροπρόθεσμης ηγετικής θέσης στο οικοσύστημα και, ουσιαστικά, τη μείωση της τριβής που εμποδίζει την υιοθέτηση πολύπλοκων συστημάτων πολλαπλών παραγόντων.

Προασπίζοντας το άνοιγμα, η Google στοχεύει να επιταχύνει ολόκληρη την αγορά πρακτόρων, τοποθετώντας την πλατφόρμα cloud και τα εργαλεία της ως κεντρικούς διευκολυντές.

Πώς λειτουργεί το A2A (Πηγή: Google)

Επαναβαθμονόμηση του Cloud Race: Το ανταγωνιστικό Gambit της Google

Αυτές οι ανακοινώσεις προσγειώνονται ακριβώς στο πλαίσιο των συνεχιζόμενων πολέμων σύννεφων. Το Google Cloud, ενώ επιδεικνύει εντυπωσιακή ανάπτυξη που συχνά τροφοδοτείται από την υιοθέτηση της τεχνητής νοημοσύνης, εξακολουθεί να κατέχει την τρίτη θέση σε μερίδιο αγοράς, μετά το AWS και το Microsoft Azure. Το Cloud Next 2025 παρουσίασε τη στρατηγική της Google για επαναβαθμονόμηση αυτής της κούρσας, κλίνοντας σε μεγάλο βαθμό στα μοναδικά δυνατά της σημεία και αντιμετωπίζοντας τις αντιληπτές αδυναμίες.

Οι βασικοί παράγοντες διαφοροποίησης της Google ήταν σε πλήρη εμφάνιση. Η μακροπρόθεσμη επένδυση σε προσαρμοσμένο πυρίτιο, με αποκορύφωμα το Ironwood TPU που εστιάζει σε συμπεράσματα, παρέχει μια ξεχωριστή αφήγηση υλικού σε σύγκριση με τα τσιπ Trainium/Inferentia της AWS και τον επιταχυντή Maia της Azure. Η Google δίνει σταθερά έμφαση στην ηγετική θέση της απόδοσης ανά βατ, ένας δυνητικά κρίσιμος παράγοντας καθώς οι ενεργειακές απαιτήσεις τεχνητής νοημοσύνης εκτινάσσονται στα ύψη. Η κυκλοφορία του Cloud WAN οπλίζει την απαράμιλλη παγκόσμια δικτυακή υποδομή της Google, προσφέροντας ένα ξεχωριστό πλεονέκτημα δικτύωσης.

Επιπλέον, η Google συνεχίζει να αξιοποιεί την κληρονομιά της στην τεχνητή νοημοσύνη και τη μηχανική μάθηση, που προέρχεται από Έρευνα του DeepMind και εκδηλώνεται στην ολοκληρωμένη πλατφόρμα Vertex AI, ευθυγραμμισμένη με την αντίληψη της αγοράς ως ηγέτη στην τεχνητή νοημοσύνη και στην ανάλυση δεδομένων.

Ταυτόχρονα, η Google σηματοδότησε προσπάθειες για την αντιμετώπιση ιστορικών επιχειρηματικών ανησυχιών. Το ογκώδες Εξαγορά 32 δισεκατομμυρίων δολαρίων της εταιρείας ασφάλειας cloud Wiz, που ανακοινώθηκε λίγο πριν το Next, είναι μια σαφής δήλωση πρόθεσης να ενισχύσει τη στάση ασφαλείας του και να βελτιώσει τη χρηστικότητα και την εμπειρία των προσφορών ασφαλείας του – τομείς κρίσιμους για την εμπιστοσύνη των επιχειρήσεων.

Η συνεχής έμφαση στις βιομηχανικές λύσεις, την ετοιμότητα των επιχειρήσεων και τις στρατηγικές συνεργασίες στοχεύει περαιτέρω στην αναμόρφωση της αντίληψης της αγοράς από έναν πάροχο καθαρής τεχνολογίας σε έναν αξιόπιστο εταιρικό συνεργάτη. 

Συνολικά, η στρατηγική της Google φαίνεται λιγότερο επικεντρωμένη στην αντιστοίχιση AWS και Azure service-for-service σε όλους τους τομείς, και περισσότερο επικεντρωμένη στη μόχλευση των μοναδικών της πλεονεκτημάτων – έρευνα τεχνητής νοημοσύνης, προσαρμοσμένο υλικό, παγκόσμιο δίκτυο και συνάφεια ανοιχτού κώδικα – για να εδραιώσει την ηγετική θέση σε αυτό που αντιλαμβάνεται ως το επόμενο κρίσιμο κύμα υπολογιστικού νέφους, ιδιαίτερα αποδοτικά συστήματα τεχνητής νοημοσύνης σε κλίμακα. 

The Road Ahead for Google AI

Το Google Cloud Next 2025 παρουσίασε μια συναρπαστική αφήγηση φιλοδοξίας και στρατηγικής συνοχής. Η Google διπλασιάζει την τεχνητή νοημοσύνη, κατανέμει τους πόρους της σε προσαρμοσμένο πυρίτιο βελτιστοποιημένο για την εποχή των συμπερασμάτων (Ironwood), ένα ισορροπημένο και πρακτικό χαρτοφυλάκιο μοντέλων τεχνητής νοημοσύνης (Gemini 2.5 Pro και Flash), τη μοναδική παγκόσμια υποδομή δικτύου της (Cloud WAN) και μια τολμηρή, ανοιχτή προσέγγιση στον αναπτυσσόμενο κόσμο των πρακτόρων AI (ADK και A2A).

Τελικά, η εκδήλωση παρουσίασε μια εταιρεία που κινείται επιθετικά για να μεταφράσει τις βαθιές τεχνολογικές της ικανότητες σε μια ολοκληρωμένη, διαφοροποιημένη επιχειρηματική προσφορά για την εποχή της τεχνητής νοημοσύνης. Η ολοκληρωμένη στρατηγική – υλικό, λογισμικό, δικτύωση και ανοιχτά πρότυπα – είναι καλή. Ωστόσο, η πορεία προς τα εμπρός απαιτεί περισσότερα από απλή καινοτομία. 

Η πιο σημαντική πρόκληση της Google μπορεί να βρίσκεται λιγότερο στην τεχνολογία και περισσότερο στην υπερνίκηση της αδράνειας υιοθέτησης των επιχειρήσεων και στην οικοδόμηση διαρκούς εμπιστοσύνης. Η μετατροπή αυτών των φιλόδοξων ανακοινώσεων σε διαρκή κέρδη μεριδίου αγοράς έναντι βαθιά εδραιωμένων ανταγωνιστών απαιτεί άψογη εκτέλεση, σαφείς στρατηγικές εισαγωγής στην αγορά και τη δυνατότητα να πείθονται συνεχώς οι μεγάλοι οργανισμοί ότι το Google Cloud είναι η απαραίτητη πλατφόρμα για το μέλλον τους που βασίζεται στην τεχνητή νοημοσύνη. Το πρακτορείο μέλλον που οραματίζεται η Google είναι συναρπαστικό, αλλά η υλοποίησή του εξαρτάται από την πλοήγηση σε αυτήν την περίπλοκη δυναμική της αγοράς πολύ καιρό αφότου τα φώτα της δημοσιότητας του Λας Βέγκας έχουν χαμηλώσει.

Ο Alex McFarland είναι δημοσιογράφος και συγγραφέας AI που εξερευνά τις τελευταίες εξελίξεις στην τεχνητή νοημοσύνη. Έχει συνεργαστεί με πολλές startups και εκδόσεις AI παγκοσμίως.