Τεχνητή νοημοσύνη

Τα LLM δεν συλλογίζονται—είναι απλώς πολύ καλοί στον προγραμματισμό

Δημοσιευμένα Φεβρουάριος 19, 2025

Δρ Tehseen Zia

Τα μεγάλα γλωσσικά μοντέλα (LLMs) όπως O3 του OpenAI, Το Gemini 2.0 της Google, να Το R1 του DeepSeek έχουν επιδείξει αξιοσημείωτη πρόοδο στην αντιμετώπιση σύνθετων προβλημάτων, στη δημιουργία κειμένου που μοιάζει με άνθρωπο, ακόμη και στη σύνταξη κώδικα με ακρίβεια. Αυτά τα προηγμένα LLM συχνά αναφέρονται ως «Μοντέλα συλλογισμού» για τις αξιοσημείωτες ικανότητές τους να αναλύουν και να λύνουν σύνθετα προβλήματα. Αλλά αυτά τα μοντέλα πραγματικά λόγος, ή είναι απλώς εξαιρετικά καλοί σχεδιασμό? Αυτή η διάκριση είναι λεπτή αλλά βαθιά και έχει σημαντικές επιπτώσεις για το πώς κατανοούμε τις δυνατότητες και τους περιορισμούς των LLM.

Για να κατανοήσουμε αυτή τη διάκριση, ας συγκρίνουμε δύο σενάρια:

Αιτιολογία: Ένας ντετέκτιβ που ερευνά ένα έγκλημα πρέπει να συγκεντρώσει αντικρουόμενα στοιχεία, να συμπεράνει ποια είναι ψευδή και να καταλήξει σε ένα συμπέρασμα που βασίζεται σε περιορισμένα στοιχεία. Αυτή η διαδικασία περιλαμβάνει συμπέρασμα, επίλυση αντιφάσεων και αφηρημένη σκέψη.
Planning: Ένας σκακιστής που υπολογίζει την καλύτερη σειρά κινήσεων για να κάνει ματ τον αντίπαλό του.

Ενώ και οι δύο διαδικασίες περιλαμβάνουν πολλά βήματα, ο ντετέκτιβ εμπλέκεται σε βαθύ συλλογισμό για να βγάλει συμπεράσματα, να αξιολογήσει τις αντιφάσεις και να εφαρμόσει γενικές αρχές σε μια συγκεκριμένη υπόθεση. Ο σκακιστής, από την άλλη πλευρά, ασχολείται κυρίως με τον σχεδιασμό, επιλέγοντας τη βέλτιστη σειρά κινήσεων για να κερδίσει το παιχνίδι. Οι LLMs, όπως θα δούμε, λειτουργούν πολύ περισσότερο σαν τον σκακιστή παρά τον ντετέκτιβ.

Κατανόηση της διαφοράς: Συλλογισμός εναντίον Σχεδιασμού

Για να συνειδητοποιήσετε γιατί τα LLM είναι καλοί στον προγραμματισμό παρά στο συλλογισμό, είναι σημαντικό να κατανοήσετε πρώτα τη διαφορά μεταξύ των δύο όρων. Η συλλογιστική είναι η διαδικασία εξαγωγής νέων συμπερασμάτων από δεδομένες προϋποθέσεις χρησιμοποιώντας τη λογική και το συμπέρασμα. Περιλαμβάνει τον εντοπισμό και τη διόρθωση ασυνεπειών, τη δημιουργία νέων γνώσεων και όχι απλώς την παροχή πληροφοριών, τη λήψη αποφάσεων σε διφορούμενες καταστάσεις και την ενασχόληση με την αιτιώδη κατανόηση και την αντίθετη σκέψη όπως «Και αν;» σενάρια.

Ο προγραμματισμός, από την άλλη πλευρά, εστιάζει στη δόμηση μιας σειράς ενεργειών για την επίτευξη ενός συγκεκριμένου στόχου. Βασίζεται στο σπάσιμο των σύνθετων εργασιών σε μικρότερα βήματα, ακολουθώντας γνωστές στρατηγικές επίλυσης προβλημάτων, προσαρμογή προηγούμενων προτύπων σε παρόμοια προβλήματα και εκτέλεση δομημένων ακολουθιών αντί να αντληθούν νέες ιδέες. Ενώ τόσο ο συλλογισμός όσο και ο σχεδιασμός περιλαμβάνουν επεξεργασία βήμα προς βήμα, ο συλλογισμός απαιτεί βαθύτερη αφαίρεση και συμπέρασμα, ενώ ο σχεδιασμός ακολουθεί καθιερωμένες διαδικασίες χωρίς να δημιουργεί θεμελιωδώς νέα γνώση.

Πώς προσεγγίζουν οι LLM το «Συλλογισμό»

Τα σύγχρονα LLM, όπως τα o3 και DeepSeek-R1 της OpenAI, είναι εξοπλισμένα με μια τεχνική, γνωστή ως Chain-of-Thought (CoT) συλλογιστική, να βελτιώσουν τις ικανότητές τους επίλυσης προβλημάτων. Αυτή η μέθοδος ενθαρρύνει τα μοντέλα να αναλύουν τα προβλήματα σε ενδιάμεσα βήματα, μιμούμενοι τον τρόπο με τον οποίο οι άνθρωποι σκέφτονται μέσα από ένα πρόβλημα λογικά. Για να δείτε πώς λειτουργεί, σκεφτείτε ένα απλό μαθηματικό πρόβλημα:

Εάν ένα κατάστημα πουλά μήλα για 2 $ το καθένα, αλλά προσφέρει έκπτωση 1 $ ανά μήλο εάν αγοράσετε περισσότερα από 5 μήλα, πόσο θα κοστίζουν τα 7 μήλα;

Ένα τυπικό LLM που χρησιμοποιεί προτροπή CoT μπορεί να το λύσει ως εξής:

Προσδιορίστε την κανονική τιμή: 7 * 2 $ = 14 $.
Προσδιορίστε ότι ισχύει η έκπτωση (από 7 > 5).
Υπολογίστε την έκπτωση: 7 * 1 $ = 7 $.
Αφαιρέστε την έκπτωση από το σύνολο: $14 – $7 = $7.

Καθορίζοντας ρητά μια ακολουθία βημάτων, το μοντέλο ελαχιστοποιεί την πιθανότητα σφαλμάτων που προκύπτουν από την προσπάθεια πρόβλεψης μιας απάντησης με μια κίνηση. Ενώ αυτή η ανάλυση βήμα προς βήμα κάνει τα LLM να μοιάζουν με συλλογισμό, είναι ουσιαστικά μια μορφή δομημένης επίλυσης προβλημάτων, σαν να ακολουθείτε μια συνταγή βήμα προς βήμα. Από την άλλη πλευρά, μια αληθινή διαδικασία συλλογισμού μπορεί να αναγνωρίσει έναν γενικό κανόνα: Εάν η έκπτωση ισχύει πέρα από 5 μήλα, τότε κάθε μήλο κοστίζει 1 $. Ένας άνθρωπος μπορεί να συναγάγει έναν τέτοιο κανόνα αμέσως, αλλά ένα LLM δεν μπορεί καθώς ακολουθεί απλώς μια δομημένη ακολουθία υπολογισμών.

Γιατί η αλυσίδα σκέψης είναι προγραμματισμός, όχι συλλογισμός

Ενώ Chain-of-Thought (CoT) Έχει βελτιώσει την απόδοση των LLM σε λογικά προσανατολισμένα καθήκοντα, όπως μαθηματικά προβλήματα και προκλήσεις κωδικοποίησης, αλλά δεν περιλαμβάνει γνήσια λογική συλλογιστική. Αυτό συμβαίνει επειδή το CoT ακολουθεί διαδικαστική γνώση, βασιζόμενο σε δομημένα βήματα αντί να παράγει νέες γνώσεις. Δεν έχει πραγματική κατανόηση της αιτιότητας και των αφηρημένων σχέσεων, που σημαίνει ότι το μοντέλο δεν εμπλέκεται σε αντιπαραδειγματική σκέψη ούτε εξετάζει υποθετικές καταστάσεις που απαιτούν διαίσθηση πέρα από τα ορατά δεδομένα. Επιπλέον, το CoT δεν μπορεί να αλλάξει ριζικά την προσέγγισή του πέρα από τα μοτίβα στα οποία έχει εκπαιδευτεί, περιορίζοντας την ικανότητά του να συλλογίζεται δημιουργικά ή να προσαρμόζεται σε άγνωστα σενάρια.

Τι θα χρειαζόταν για τα LLM να γίνουν αληθινές μηχανές συλλογισμού;

Λοιπόν, τι χρειάζονται οι LLM για να συλλογιστούν πραγματικά όπως οι άνθρωποι; Ακολουθούν ορισμένοι βασικοί τομείς όπου απαιτούν βελτίωση και πιθανές προσεγγίσεις για να το επιτύχουν:

Συμβολική Κατανόηση: Οι άνθρωποι λογίζονται χειραγωγώντας αφηρημένα σύμβολα και σχέσεις. Τα LLM, ωστόσο, στερούνται έναν γνήσιο συμβολικό συλλογιστικό μηχανισμό. Η ενσωμάτωση συμβολικής τεχνητής νοημοσύνης ή υβριδικών μοντέλων που συνδυάζουν νευρωνικά δίκτυα με επίσημα λογικά συστήματα θα μπορούσε να ενισχύσει την ικανότητά τους να εμπλέκονται σε αληθινό συλλογισμό.
Αιτιώδη συμπεράσματα: Ο αληθινός συλλογισμός απαιτεί την κατανόηση της αιτίας και του αποτελέσματος, όχι μόνο στατιστικές συσχετίσεις. Ένα μοντέλο που οι λόγοι πρέπει να συνάγουν τις βασικές αρχές από τα δεδομένα αντί να προβλέπουν απλώς το επόμενο διακριτικό. Η έρευνα για την αιτιακή τεχνητή νοημοσύνη, η οποία μοντελοποιεί ρητά τις σχέσεις αιτίας-αποτελέσματος, θα μπορούσε να βοηθήσει τους LLM να μεταβούν από τον προγραμματισμό στη λογική.
Αυτο-προβληματισμός και Μεταγνώση: Οι άνθρωποι αξιολογούν συνεχώς τις δικές τους διαδικασίες σκέψης ρωτώντας «Έχει νόημα αυτό το συμπέρασμα;» Τα LLM, από την άλλη, δεν διαθέτουν μηχανισμό αυτοστοχασμού. Η δημιουργία μοντέλων που μπορούν να αξιολογήσουν κριτικά τα δικά τους αποτελέσματα θα ήταν ένα βήμα προς την αληθινή λογική.
Κοινή Λογική και Διαίσθηση: Παρόλο που οι LLM έχουν πρόσβαση σε τεράστιες ποσότητες γνώσεων, συχνά αγωνίζονται με τη βασική λογική κοινής λογικής. Αυτό συμβαίνει επειδή δεν έχουν εμπειρίες από τον πραγματικό κόσμο για να διαμορφώσουν τη διαίσθησή τους και δεν μπορούν εύκολα να αναγνωρίσουν τους παραλογισμούς που θα έπιαναν οι άνθρωποι αμέσως. Δεν έχουν επίσης έναν τρόπο να φέρουν τη δυναμική του πραγματικού κόσμου στη λήψη των αποφάσεών τους. Ένας τρόπος για να βελτιωθεί αυτό θα μπορούσε να είναι η κατασκευή ενός μοντέλου με μια μηχανή κοινής λογικής, η οποία μπορεί να περιλαμβάνει την ενσωμάτωση των αισθητηριακών εισροών του πραγματικού κόσμου ή τη χρήση γραφημάτων γνώσης για να βοηθήσει το μοντέλο να κατανοήσει καλύτερα τον κόσμο όπως κάνουν οι άνθρωποι.
Αντιπαραστατική Σκέψη: Η ανθρώπινη συλλογιστική συχνά περιλαμβάνει το ερώτημα «Τι θα γινόταν αν τα πράγματα ήταν διαφορετικά;» Οι LLM δυσκολεύονται με τέτοιου είδους σενάρια τύπου «τι θα γινόταν αν» επειδή περιορίζονται από τα δεδομένα στα οποία έχουν εκπαιδευτεί. Για να μπορέσουν τα μοντέλα να σκέφτονται περισσότερο σαν άνθρωποι σε αυτές τις καταστάσεις, θα πρέπει να προσομοιώνουν υποθετικά σενάρια και να κατανοούν πώς οι αλλαγές στις μεταβλητές μπορούν να επηρεάσουν τα αποτελέσματα. Θα χρειάζονταν επίσης έναν τρόπο να δοκιμάζουν διαφορετικές πιθανότητες και να καταλήγουν σε νέες γνώσεις, αντί να προβλέπουν απλώς με βάση αυτά που έχουν ήδη δει. Χωρίς αυτές τις ικανότητες, οι LLM δεν μπορούν πραγματικά να φανταστούν εναλλακτικά μέλλοντα — μπορούν να εργαστούν μόνο με αυτά που έχουν μάθει.

Συμπέρασμα

Ενώ οι LLM μπορεί να φαίνεται ότι έχουν συλλογισμό, στην πραγματικότητα βασίζονται σε τεχνικές σχεδιασμού για την επίλυση σύνθετων προβλημάτων. Είτε λύνουν ένα μαθηματικό πρόβλημα είτε ασχολούνται με λογική επαγωγή, οργανώνουν κυρίως γνωστά μοτίβα με δομημένο τρόπο αντί να κατανοούν σε βάθος τις αρχές που τα διέπουν. Αυτή η διάκριση είναι κρίσιμη στην έρευνα για την Τεχνητή Νοημοσύνη, επειδή αν μπερδέψουμε τον περίπλοκο σχεδιασμό με την γνήσια συλλογιστική, κινδυνεύουμε να υπερεκτιμήσουμε τις πραγματικές δυνατότητες της Τεχνητής Νοημοσύνης.

Ο δρόμος προς την αληθινή λογική τεχνητής νοημοσύνης θα απαιτήσει θεμελιώδεις εξελίξεις πέρα από την πρόβλεψη συμβολικών και τον πιθανό προγραμματισμό. Θα απαιτήσει καινοτομίες στη συμβολική λογική, την αιτιολογική κατανόηση και τη μεταγνώση. Μέχρι τότε, τα LLM θα παραμείνουν ισχυρά εργαλεία για δομημένη επίλυση προβλημάτων, αλλά δεν θα σκέφτονται πραγματικά με τον τρόπο που σκέφτονται οι άνθρωποι.

Σχετικά θέματα:Abstract Reasoning σε LLMs Γνωστικές ικανότητες AI Λογικός συλλογισμός AI AI Metacognition Συλλογισμός AI έναντι προγραμματισμού AI Αυτοστοχασμός Περιστασιακός συλλογισμός σε LLM Αιτιώδη συμπεράσματα Αιτιωτικός συλλογισμός Chain-of-Thought (CoT)Ο συλλογισμός κοινής λογικής στα LLMs DeepSeek-R1 Google Gemini 2.0 Μεγάλα μοντέλα γλωσσών (LLM)συλλογισμός LLM Μηχανική συλλογιστική Νευροσυμβολικός συλλογισμός OpenAI o3 Συμβολικός συλλογισμός

Επόμενο

Εργαλείο «Co-Scientist» της AI της Google: Επανάσταση στη βιοϊατρική έρευνα

Μην χάσετε

Η Mira Murati εγκαινιάζει το Thinking Machines Lab: The Next Big AI Challenger

Δρ Tehseen Zia

Ο Δρ. Tehseen Zia είναι Αναπληρωτής Καθηγητής στο Πανεπιστήμιο COMSATS του Ισλαμαμπάντ, κάτοχος διδακτορικού τίτλου στην τεχνητή νοημοσύνη από το Τεχνολογικό Πανεπιστήμιο της Βιέννης, στην Αυστρία. Με ειδίκευση στην Τεχνητή Νοημοσύνη, τη Μηχανική Μάθηση, την Επιστήμη των Δεδομένων και την Όραση Υπολογιστών, έχει κάνει σημαντικές συνεισφορές με δημοσιεύσεις σε έγκριτα επιστημονικά περιοδικά. Ο Δρ. Tehseen έχει επίσης ηγηθεί διαφόρων βιομηχανικών έργων ως Κύριος Ερευνητής και υπηρέτησε ως Σύμβουλος AI.

Unite.AI

Τα LLM δεν συλλογίζονται—είναι απλώς πολύ καλοί στον προγραμματισμό

Κατανόηση της διαφοράς: Συλλογισμός εναντίον Σχεδιασμού

Πώς προσεγγίζουν οι LLM το «Συλλογισμό»

Γιατί η αλυσίδα σκέψης είναι προγραμματισμός, όχι συλλογισμός

Τι θα χρειαζόταν για τα LLM να γίνουν αληθινές μηχανές συλλογισμού;

Συμπέρασμα

Μπορεί να σου αρέσει