Τεχνητή νοημοσύνη
Το Τέλος της Αλυσίδας Σκέψης; Οι Ερευνητές του CoreThink και του Πανεπιστημίου της Καλιφόρνιας Προτείνουν Μια Παράμετρο Μετατόπισης στη Λογική του AI

Για χρόνια, ο αγώνας στην τεχνητή νοημοσύνη ήταν για κλίμακα. Μεγαλύτερα μοντέλα, περισσότερα GPU, μεγαλύτερες προτροπές. Η OpenAI, η Anthropic και η Google έχουν ηγηθεί της φόρμας με τεράστια μεγάλα μοντέλα γλωσσικών μοντέλων (LLM), εκπαίδευση με ενίσχυση και προτροπή αλυσίδας σκέψης—τεχνικές που σχεδιάστηκαν για να προσομοιώσουν τη σκέψη με την εξήγηση βήμα προς βήμα απαντήσεων.
Αλλά một νέο τεχνικό λευκό χαρτί με τίτλο CoreThink: Ένας Συμβολικός Λογικός για να συλλογιστεί πάνω από Μακροχρόνιες Δουλειές με LLM από CoreThink AI και ερευνητές του Πανεπιστημίου της Καλιφόρνιας υποστηρίζει ότι αυτό το παράδειγμα μπορεί να φτάσει στο όριο του. Οι συγγραφείς κάνουν μια προκλητική αξίωση: Τα LLM είναι ισχυρά στατιστικά γλωσσικά γεννήτορες, αλλά δεν είναι μηχανές σκέψης. Και η αλυσίδα σκέψης, η μέθοδος που χρησιμοποιείται πιο συχνά για να προτείνει το αντίθετο, είναι περισσότερο θέατρο απόperformance παρά γνήσια λογική.
Σε απάντηση, η ομάδα εισάγει Γενικούς Συμβολικούς, ένα νευρο-συμβολικό επίπεδο συλλογισμού που σχεδιάστηκε για να συνδεθεί με τα υπάρχοντα μοντέλα. Οι αξιολογήσεις τους δείχνουν δραματικές βελτιώσεις σε ένα ευρύ φάσμα δοκιμών συλλογισμού—επιτευχθείσες χωρίς επαναεκπαίδευση ή πρόσθετο κόστος GPU. Αν επαληθευτεί, αυτή η προσέγγιση θα μπορούσε να σηματοδοτήσει ένα σημείο καμπής στο πώς τα συστήματα AI σχεδιάζονται για λογική και λήψη αποφάσεων.
Τι Είναι η Αλυσίδα Σκέψης — και Γιατί Μετράει
Η αλυσίδα σκέψης (CoT) προτροπή έχει γίνει μια από τις πιο ευρέως αποδεκτές τεχνικές στη σύγχρονη AI. Ζητώντας από ένα μοντέλο να γράψει τα βήματα συλλογισμού του πριν από την παράδοση μιας απάντησης, οι ερευνητές βρήκαν ότι θα μπορούσαν συχνά να βελτιώσουν τα σκορ των δοκιμών σε περιοχές όπως τα μαθηματικά, η κωδικοποίηση και η σχεδίαση. Στην επιφάνεια, φαινόταν σαν μια επέκταση.
Ωστόσο, η αναφορά υπογραμμίζει τις περιορισμοί αυτής της προσέγγισης. Οι εξηγήσεις CoT μπορεί να φαίνονται πειστικές, αλλά μελέτες δείχνουν ότι είναι συχνά απιστές σε σχέση με αυτό που το μοντέλο πραγματικά υπολόγισε, racionalizing εξόδους μετά το γεγονός παρά αποκαλύπτοντας τη γνήσια λογική. Αυτό δημιουργεί πραγματικούς κινδύνους. Στην ιατρική, ένα πιθανό αφηγηματικό μπορεί να κρύψει την εξάρτηση από ψευδείς συσχετίσεις, οδηγώντας σε επικίνδυνες λανθασμένες διαγνώσεις. Στον νόμο, πλασματικές αιτιολογίες θα μπορούσαν να συγχέονται με γνήσιες αιτιολογίες, απειλώντας τη δίκαιη διαδικασία και την ευθύνη.
Το έγγραφο υπογραμμίζει επίσης την αναποτελεσματικότητα: Οι αλυσίδες CoT συχνά μεγαλώνουν υπερβολικά σε απλά προβλήματα, ενώ συρρικνώνονται σε ρηχές συλλογιστικές σε σύνθετα. Το αποτέλεσμα είναι η σπατάλη υπολογισμού και, σε πολλές περιπτώσεις, μειωμένη ακρίβεια. Οι συγγραφείς καταλήγουν στο συμπέρασμα ότι η αλυσίδα σκέψης είναι “εμφανισιακή, όχι μηχανιστική”—μια επιφανειακή επίδειξη που δημιουργεί την ψευδαίσθηση της ερμηνευσιμότητας χωρίς να την παρέχει.
Συμβολική AI: Από τα Πρώιμα Όνειρα στις Νέες Αναβίωσεις
Η κριτική της CoT μας προσκαλεί να κοιτάξουμε πίσω στην ιστορία της συμβολικής AI. Στις πρώτες δεκαετίες, η έρευνα της AI επικεντρώθηκε σε συστήματα που κωδικοποιούσαν τη γνώση σε ρητή λογική μορφή. Συστήματα εμπειρογνωμόνων όπως το MYCIN προσπάθησαν να διαγνώσουν ασθένειες εφαρμόζοντας χειροποίητα κανόνες, και συστήματα ανίχνευσης απάτης βασίζονταν σε τεράστιους συνόλους λογικής για να πιάσουν ανωμαλίες.
Συμβολική AI είχε αναμφισβήτητες δυνάμεις: κάθε βήμα της σκέψης της ήταν διαφανές και αναγνωρίσιμο. Αλλά αυτά τα συστήματα ήταν εύθραυστα. Η κωδικοποίηση δεκάδων χιλιάδων κανόνων απαιτούσε τεράστια εργασία, και είχαν δυσκολία όταν αντιμετώπιζαν νέες καταστάσεις. Κριτικοί όπως ο Hubert Dreyfus υποστήριξαν ότι η ανθρώπινη νοημοσύνη εξαρτάται από τακτικές, контекστο-οδηγούμενες γνώσεις που κανένα σύνολο κανόνων δεν θα μπορούσε να καταγράψει. Μέχρι τη δεκαετία του 1990, οι συμβολικές προσεγγίσεις έδωσαν τη θέση τους στα δίκτυα νευρώνων που οδηγούνται από δεδομένα.
Τα τελευταία χρόνια, υπήρξε μια ανανεωμένη προσπάθεια να συνδυάσει τις δυνάμεις και των δύο κόσμων μέσω νευρο-συμβολικής AI. Η ιδέα είναι απλή: αφήστε τα νευρωνικά δίκτυα να χειρίζονται ακατέργαστες, αισθητηριακές εισόδους όπως εικόνες ή κείμενο, ενώ οι συμβολικοί 모δούλοι παρέχουν δομημένη σκέψη και λογικές εγγυήσεις. Αλλά τα περισσότερα από αυτά τα υβρίδια έχουν δυσκολία με την ολοκλήρωση. Οι συμβολικοί σκελετοί ήταν πολύ σκληροί, ενώ οι νευρωνικοί модούλοι συχνά υπονόμευαν τη συνεπήτητα. Το αποτέλεσμα ήταν σύνθετα, βαρέα συστήματα που απέτυχαν να παρέχουν την υποσχόμενη ερμηνευσιμότητα.
Γενικοί Συμβολικοί: Ένα Νέο Επίπεδο Συλλογισμού
Το Γενικό Συμβολικό Reasoner (GSR) του CoreThink αποσκοπεί να υπερβεί αυτές τις περιορισμοί με μια διαφορετική προσέγγιση. Αντί να μεταφράζει γλώσσα σε σκληρές формικές δομές ή υψηλοδιάστατες ενσωματώσεις, το GSR λειτουργεί εξ ολοκλήρου μέσα στη φυσική γλώσσα. Κάθε βήμα συλλογισμού εκφράζεται με λόγια, εξασφαλίζοντας ότι ο контекστ, η νюανς και η modality διατηρούνται. Αυτό σημαίνει ότι οι διαφορές όπως “πρέπει” versus “πρέπει” μεταφέρονται μέσω της διαδικασίας συλλογισμού, αντί να αφαίρεθούν.
Το πλαίσιο λειτουργεί με την ανάλυση εισόδων αυτοχθόνως σε φυσική γλώσσα, εφαρμόζοντας λογικές περιορισμοί μέσω γλωσσικών μετασχηματισμών και παράγοντας λέξεις-λέξεις αποτυπώματα συλλογισμού που παραμένουν πλήρως ανθρώπινα-διαβάσιμα. Όταν αντιφάσεις ή σφάλματα εμφανίζονται, εμφανίζονται trực tiếp στη διαδικασία συλλογισμού, επιτρέποντας τη διαφάνεια και την αποσφαλμάτωση. Για να παραμείνει αποτελεσματικό, το σύστημα αποκόπτει ненужικά βήματα, επιτρέποντας σταθερή μακροχρόνια συλλογιστική χωρίς κλιμάκωση GPU.
Επειδή λειτουργεί ως ένα επίπεδο και όχι ως eine αναγκαία επαναεκπαίδευση, το GSR μπορεί να εφαρμοστεί σε υπάρχοντα βασικά μοντέλα. Σε αξιολογήσεις, παρείχε συνεχώς βελτιώσεις ακρίβειας μεταξύ 30 και 60 τοις εκατό σε εργασίες συλλογισμού, όλα χωρίς αύξηση του κόστους εκπαίδευσης.
Αποτελέσματα Benchmark
Οι βελτιώσεις είναι καλύτερα εικονογραφημένες μέσω benchmark. Στο LiveCodeBench v6, το οποίο αξιολογεί προβλήματα κωδικοποίησης ανταγωνισμού, το CoreThink πέτυχε ποσοστό 66,6 τοις εκατό—σημαντικά υψηλότερο από τα ηγετικά μοντέλα στην κατηγορία. Στο SWE-Bench Lite, ένα benchmark για πραγματικά προβλήματα επιδιόρθωσης από αποθήκες GitHub, το σύστημα έφτασε στο 62,3 τοις εκατό ακρίβεια, το υψηλότερο αποτέλεσμα που έχει αναφερθεί. Και στο ARC-AGI-2, ένα από τα πιο απαιτητικά τεστ αφηρημένης συλλογιστικής, έπιασε το 24,4 τοις εκατό, υπερβαίνοντας τα μοντέλα της πρωτοπορίας όπως το Claude και το Gemini, τα οποία παραμένουν κάτω από το 6 τοις εκατό.
Αυτά τα νούμερα αντανακλούν περισσότερο από την καθαρή ακρίβεια. Σε λεπτομερείς μελέτες περιπτώσεων, το συμβολικό επίπεδο επέτρεψε στα μοντέλα να ενεργούν διαφορετικά. Στο ColumnTransformer του scikit-learn, για παράδειγμα, ένα βασικό μοντέλο πρότεινε μια επιφανειακή επιδιόρθωση που έκρυβε το σφάλμα. Το CoreThink-ενισχυμένο σύστημα αντίθετα ταυτοποίησε το πρόβλημα συγχρονισμού στη ρίζα και το διόρθωσε ολοκληρωτικά. Σε μια δύσκολη πρόκληση LeetCode, το βασικό μοντέλο εφαρμόστηκε λανθασμένα τη δυναμική προγραμματισμό και απέτυχε εντελώς, ενώ το συμβολικό επίπεδο συλλογισμού διόρθωσε την ελαττωματική αναπαράσταση κατάστασης και παρήγαγε μια λειτουργική λύση.
Πώς Ταιριάζει στη Συμβολική Αναβίωση
Οι Γενικοί Συμβολικοί εντάσσονται σε μια αυξανόμενη κίνηση να φέρουν δομή πίσω στη σκέψη του AI. Η κλασική συμβολική AI έδειξε την αξία της διαφάνειας αλλά δεν μπορούσε να προσαρμοστεί στη νεωτερικότητα. Οι παραδοσιακές νευρο-συμβολικές υβρίδες υποσχέθηκαν ισορροπία αλλά συχνά έγιναν ακαδημαϊκές. Οι στοίβες προγραμματιστών που έθεσαν αναζήτηση σε LLMs πρόσφεραν πρώιμη ελπίδα αλλά κατέρρευσαν κάτω από τη σύνθετη πολυπλοκότητα καθώς οι εργασίες κλιμακώθηκαν.
Οι πρόσφατες προόδους δείχνουν το δυναμικό νέων υβριδίων. Το AlphaGeometry της DeepMind, για παράδειγμα, έχει αποδείξει ότι οι συμβολικές δομές μπορούν να υπερβούν τα καθαρά νευρωνικά μοντέλα σε προβλήματα γεωμετρίας. Η προσέγγιση του CoreThink επεκτείνει αυτή τη τάση. Στο pipeline ARC-AGI, η детерμινιστική ανίχνευση αντικειμένων και η συμβολική αφαίρεση προτύπων συνδυάζονται με νευρωνική εκτέλεση, παράγοντας αποτελέσματα πολύ πέρα από αυτά των LLM-only συστημάτων. Στη χρήση εργαλείων, το συμβολικό επίπεδο βοηθά στην διατήρηση του контекστ και στην επιβολή περιορισμών, επιτρέποντας πιο αξιόπιστη πολλαπλή σχεδίαση.
Η κλειδί διαφορά είναι ότι οι Γενικοί Συμβολικοί δεν βασίζονται σε σκληρές λογικές ή τεράστιες επαναεκπαιδεύσεις. Λειτουργώντας直接 στη γλώσσα, παραμένει ευέλικτο ενώ διατηρεί την ερμηνευσιμότητα. Αυτό το καθιστά ελαφρύτερο από τα προηγούμενα υβρίδια και, κρίσιμο, πρακτικό για ολοκλήρωση σε επιχειρηματικές εφαρμογές.
Γιατί Μετράει
Εάν η αλυσίδα σκέψης είναι μια ψευδαίσθηση της σκέψης, τότε η βιομηχανία AI αντιμετωπίζει μια επείγουσα πρόκληση. Οι επιχειρήσεις δεν μπορούν να βασιστούν σε συστήματα που μόνο φαίνονται να συλλογίζονται, ιδίως σε υψηλούς κινδύνους περιβάλλοντα όπως η ιατρική, ο νόμος και η finance. Το έγγραφο υποδηλώνει ότι η πραγματική πρόοδος θα έρθει όχι από την κλιμάκωση των μοντέλων, αλλά από την επανεξέταση των θεμελίων της σκέψης.
Οι Γενικοί Συμβολικοί είναι μια τέτοια βάση. Προσφέρουν ένα ελαφρύ, ερμηνεύσιμο επίπεδο που μπορεί να ενισχύσει τα υπάρχοντα μοντέλα χωρίς επαναεκπαίδευση, παράγοντας γνήσιες βελτιώσεις συλλογισμού αντί για επιφανειακές αφηγήσεις. Για την ευρύτερη κοινότητα AI, σηματοδοτεί μια πιθανή παράμετρο μετατόπισης: μια επιστροφή της συμβολικής σκέψης, όχι ως εύθραυστα σύνολα κανόνων, αλλά ως ένα ευέλικτο σύντροφο της νευρωνικής μάθησης.
Όπως το λένε οι συγγραφείς: “Δεν χρειάζεται να προσθέσουμε περισσότερους παραμέτρους για να πάρουμε καλύτερη σκέψη—χρειάζεται να ξανασκεφτούμε τις βάσεις.”












