Τεχνητή νοημοσύνη
OpenAI και Anthropic Εκτοξεύουν Ανταγωνιστικά Μοντέλα καθώς ο Αγώνας Όπλων της Τεχνητής Νοημοσύνης Εντείνεται

Η OpenAI και η Anthropic κυκλοφόρησαν νέα μοντέλα φLAGSHIP μέσα σε λίγα λεπτά η μια από την άλλη σήμερα, ενώ η OpenAI εκτόξευσε ταυτόχρονα μια πλατφόρμα επιχειρηματικών πρακτόρων και η Perplexity εισήγαγε μια λειτουργία πολλαπλών μοντέλων ερεύνης. Η σημερινή ημέρα παρείχε σημαντικές ανακοινώσεις προϊόντων τεχνητής νοημοσύνης σε ένα seul απόγευμα περισσότερες από όσες οι περισσότερες εβδομάδες παράγουν συνολικά.
Αυτό είναι το τι κυκλοφόρησε και τι σημαίνει.
Το Opus 4.6 της Anthropic: Ομάδες Πρακτόρων και ένα Παράθυρο Εκατομμυρίου Token
Η Anthropic κυκλοφόρησε το Claude Opus 4.6, το πιο ικανό μοντέλο της, με δύο βασικές λειτουργίες: ένα παράθυρο контекστού ενός εκατομμυρίου token και μια νέα ικανότητα που ονομάζεται Ομάδες Πρακτόρων.
Το παράθυρο контекστού είναι η μεγαλύτερη τεχνική επίτευξη. Σε ένα εκατομμύριο token, το Opus 4.6 μπορεί να επεξεργαστεί περίπου 3.000 σελίδες κειμένου σε μια seule πρόκληση — τέσσερις φορές το όριο 256.000 token του προκατόχου του. Σε συνδυασμό με την υποστήριξη εξόδου 128.000 token, το μοντέλο μπορεί τώρα να καταναλώσει και να εργαστεί με ολόκληρες βάσεις κώδικα, ρυθμιστικές υποβολές ή ερευνητικά σώματα χωρίς chunking ή περίληψη.
Ομάδες Πρακτόρων, διαθέσιμες στο Claude Code, επιτρέπουν σε πολλαπλά实例 του Claude να εργάζονται παράλληλα σε μια κοινή βάση κώδικα. Αντί να εκτελείται ένας πρακτόρας σειριακά, οι dévelopπεurs μπορούν να δημιουργήσουν ομάδες όπου ένας πρακτόρας χειρίζεται αλλαγές στο frontend, ένας άλλος γράφει 테στ και ένας τρίτος ανα cấu trúc_BACKEND λογική — όλα συντονίζονται στην ίδια έργο ταυτόχρονα.
Το Opus 4.6 εισάγει επίσης την προσαρμοστική σκέψη, η οποία επιτρέπει στο μοντέλο να ρυθμίζει πόσο προσπάθεια σκέψης να επενδύσει σε μια δεδομένη πρόκληση. Απλές ερωτήσεις λαμβάνουν γρήγορες απαντήσεις· σύνθετα προβλήματα προκαλούν βαθύτερη επέκταση σκέψης. Οι dévelopπεurs μπορούν να điều chỉnh αυτό μέσω ελέγχων προσπάθειας σε τέσσερα επίπεδα: χαμηλό, μεσαίο, υψηλό και μέγιστο.
Στα βENCHMARK, το Opus 4.6 σκοράρει υψηλότερα στο Terminal-Bench 2.0 για agentic κώδικα και προηγείται στο Humanity’s Last Exam, μια σύνθετη αξιολόγηση λογικής. Η Anthropic ισχυρίζεται ότι έχει einen 144-point Elo πλεονέκτημα έναντι του GPT-5.2 στο GDPval-AA evaluation και μια βελτίωση 190 пункτών έναντι του Opus 4.5.
Η τιμολόγηση API παραμένει αμετάβλητη στα 5 δολάρια ανά εκατομμύριο εισόδου token και 25 δολάρια ανά εκατομμύριο εξόδου token, αν και προκλήσεις που υπερβαίνουν τα 200.000 token φέρουν μια premium τιμή 10/37,50 δολαρίων.
Σε μια αξιοσημείωτη κίνηση επιχείρησης, η Anthropic ανακοίνωσε μια έρευνα προεπισκόπησης του Claude στο Microsoft PowerPoint, όπου το μοντέλο μπορεί να διαβάσει υπάρχοντες σχεδιασμούς και προτυπά διαφανειών και να δημιουργήσει ή να επεξεργαστεί παρουσιάσεις διατηρώντας τη μορφοποίηση μάρκας.
Το GPT-5.3-Codex της OpenAI: Το Μοντέλο που Βοήθησε να Κτιστεί το Ίδιο
Λίγα λεπτά μετά την ανακοίνωση της Anthropic, η OpenAI εκτόξευσε το GPT-5.3-Codex, το πιο ικανό μοντέλο κώδικα. Η κυκλοφορία ενοποιεί την κωδικοποίηση του GPT-5.2-Codex με τις ικανότητες λογικής και επαγγελματικής γνώσης του GPT-5.2 σε ένα ενιαίο σύστημα που είναι επίσης 25% ταχύτερο.
Η πιο αξιοσημείωτη αξίωση: το GPT-5.3-Codex βοήθησε να κτιστεί το ίδιο. Η ομάδα Codex της OpenAI использовала πρώιμες εκδοχές του μοντέλου κατά τη διάρκεια της δικής του διαδικασίας εκπαίδευσης — αποσφαλματώντας εκτελέσεις εκπαίδευσης, διαχειριζόμενη υποδομή αναπτύξεως και διαγνώσεων αποτελεσμάτων αξιολόγησης. Είναι η πρώτη δημόσια αναγνώριση της OpenAI ότι ένα μοντέλο ήταν ουσιαστικό στην ανάπτυξή του, ένα ορόσημο που αυξάνει τόσο την αποτελεσματικότητα όσο και τις αμφιβολίες ασφαλείας.
Το GPT-5.3-Codex θέτει νέα βιομηχανικά υψηλά στο SWE-Bench Pro και Terminal-Bench, τα οποία αξιολογούν πραγματικές εργασίες λογισμικού. Το μοντέλο μπορεί να χειρίζεται μακροχρόνιες εργασίες που涉ňují έρευνα, χρήση εργαλείων και σύνθετη εκτέλεση, και οι χρήστες μπορούν να αλληλεπιδρούν με αυτό κατά τη διάρκεια της εργασίας χωρίς να χάνουν το контекスト — περισσότερο σαν να συνεργάζονται με einen συνάδελφο παρά να εκδίδουν εντολές.
Το μοντέλο είναι διαθέσιμο τώρα σε όλους τους χρήστες του ChatGPT με πληρωμένα σχέδια μέσω της εφαρμογής Codex, CLI, επέκτασης IDE και διαδικτυακού介面. Η πρόσβαση API έρχεται σύντομα.
Για τους développeurs που επιλέγουν μεταξύ γεννητόρων κώδικα AI, το ανταγωνιστικό σκηνικό είναι τώρα καθαρό: το Opus 4.6 προηγείται στην συντονισμό πρακτόρων και εργασία μακρού контекστού, ενώ το GPT-5.3-Codex τονίζει την ταχύτητα και την ολοκληρωμένη λογική. Και τα δύο μοντέλα ισχυρίζονται υψηλότερα σημεία σε επικαλυπτόμενες αξιολογήσεις, και εργαλεία όπως Cursor και Apple’s Xcode υποστηρίζουν και τα δύο, ώστε οι développeurs να μπορούν να αλλάξουν ελεύθερα.
Η OpenAI Frontier: Επιχειρηματικοί Πράκτορες Λάβουν τη Δική τους Πλατφόρμα
Παράλληλα με την κυκλοφορία του μοντέλου, η OpenAI παρουσίασε την Frontier, μια επιχειρηματική πλατφόρμα για την κατασκευή, ανάπτυξη και διαχείριση πρακτόρων AI. Η Frontier συνδέεται με βάσεις δεδομένων, συστήματα CRM, πλατφόρμες HR, εργαλεία ticketing και άλλα επιχειρηματικά εφαρμογές, και στη συνέχεια επιτρέπει στους πρακτόρες AI να εκτελούν διαδικασίες σε αυτά.
Η OpenAI περιέγραψε την Frontier ως “ένα σεμαντικό επίπεδο για την επιχείρηση” όπου οι ανθρώπινοι υπάλληλοι και οι πρακτόρες AI λειτουργούν στην ίδια πλατφόρμα με κοινή πρόσβαση δεδομένων και ελέγχους ασφαλείας. Οι πρακτόρες λαμβάνουν ταυτότητες εργαζομένου, κοινή οργανωτική контекστού και επιχειρηματικά επιπέδου άδειες.
Η πλατφόρμα είναι αδιάκριτη μοντέλων — οι εταιρείες μπορούν να διαχειριστούν πρακτόρες που κατασκευάζονται με μοντέλα της OpenAI μαζί με εκείνους από την Google, τη Microsoft και την Anthropic. Αρχικοί πελάτες περιλαμβάνουν Intuit, State Farm, Thermo Fisher και Uber.
Η Frontier θέτει την OpenAI σε θέση να ανταγωνιστεί απευθείας με επιχειρηματικές πλατφόρμες όπως η Agentforce της Salesforce και οι πράκτορες AI της ServiceNow. Η διαφορά: η OpenAI κατασκευάζει από το επίπεδο μοντέλου και πάνω, ενώ οι incumbents προσθέτουν τεχνητή νοημοσύνη σε υπάρχοντα εργαλεία ροής εργασιών. Εάν οι επιχειρήσεις προτιμούν την υποδομή πρακτόρων τους από τον παρόχο AI ή τον προμηθευτή λογισμικού θα καθορίσει τον ανταγωνισμό επιχειρηματικής τεχνητής νοημοσύνης το 2026.
Το Model Council της Perplexity: Τρία Μοντέλα, Μια Απάντηση
Η Perplexity παρουσίασε το Model Council, μια λειτουργία που εκτελεί την ίδια ερώτηση σε τρία μοντέλα ταυτόχρονα — Claude Opus, GPT και Gemini — και στη συνέχεια χρησιμοποιεί ένα μοντέλο συνθέτη για να συνδυάσει τις εξόδους τους σε μια seule απάντηση που σηματοδοτεί τις περιοχές συμφωνίας και διαφωνίας.

Εικόνα: Perplexity
Η πρόθεση είναι ότι κανένα μοντέλο δεν είναι αξιόπιστο καλύτερο σε όλες τις ερωτήσεις. Όταν τρία μοντέλα frontier συμφωνούν στην ίδια απάντηση, η εμπιστοσύνη είναι υψηλή. Όταν διαφωνούν, οι χρήστες γνωρίζουν να ερευνήσουν περαιτέρω. Το Model Council είναι διαθέσιμο σε συνδρομητές Max και προορίζεται για έρευνα επενδύσεων, στρατηγική ανάλυση και σύνθετες αποφάσεις.
Η λειτουργία αντανακλά την στρατηγική της Perplexity για διαφοροποίηση μέσω πολλαπλής ορχήστρασης μοντέλων αντί για την κατασκευή μοντέλων θεμελίωσης. Όσο η διαφορά μεταξύ μοντέλων frontier AI chatbots στενεύει σε ατομικές αξιολογήσεις, η συσσώρευση των εξόδων τους μπορεί να αποδειχθεί πιο πολύτιμη από την επιλογή ενός μοντέλου.
Τι Όλα Αυτά Σημαίνουν
Αυτές οι κυκλοφορίες επιβεβαιώνουν ότι ο ανταγωνισμός της τεχνητής νοημοσύνης έχει μετατοπιστεί από την ικανότητα μοντέλων σε υποδομή προϊόντων. Και η OpenAI και η Anthropic έχουν μοντέλα που ξεπερνούν τις ίδιες αξιολογήσεις· η διαφοροποίηση ζει τώρα σε αυτό που μπορείτε να κατασκευάσετε πάνω τους.
Η Perplexity, ενώ, κάνει μια ήσυχη επιχείρηση ότι οι πόλεμοι μοντέλων μπορεί να είναι λιγότερο σημαντικοί από το πώς συνδυάζετε μοντέλα. Εάν το Model Council αποδειχθεί χρήσιμο, υποδηλώνει ότι το μέλλον δεν είναι η επιλογή μεταξύ Claude και GPT — είναι η χρήση και των δύο.
Για τους développeurs και τις επιχειρήσεις που αξιολογούν το στάκ τους AI, αυτό έκανε την απόφαση πιο δύσκολη.












