Τεχνητή νοημοσύνη

Το πρώτο έτος του ChatGPT: Ανασχηματίζοντας το Μέλλον της Αλληλεπίδρασης με τον AI

Δημοσιεύτηκε 6 Δεκεμβρίου 2023

Ενημερώθηκε 22 Μαΐου 2026

Aayush Mittal Mittal

Αναλογιζόμενοι το πρώτο έτος του ChatGPT, είναι σαφές ότι αυτό το εργαλείο έχει αλλάξει σημαντικά την σκηνή του AI. Κυκλοφορώντας στο τέλος του 2022, το ChatGPT ξεχώρισε λόγω του φιλικού προς τον χρήστη, διαλογικού στυλ που έκανε την αλληλεπίδραση με τον AI να feels σαν να μιλάς με ένα άτομο και όχι με μια μηχανή. Αυτή η νέα προσέγγιση προσελκύσε γρήγορα το δημόσιο βλέμμα. Μέσα σε πέντε ημέρες μετά την κυκλοφορία του, το ChatGPT είχε ήδη προσελκύσει ένα εκατομμύριο χρήστες. Στο πρώτο τρίμηνο του 2023, αυτό το νούμερο έφτασε τα 100 εκατομμύρια μηνιαίους χρήστες, και μέχρι τον Οκτώβριο, η πλατφόρμα drew σε περίπου 1,7 δισεκατομμύρια επισκέψεις σε όλο τον κόσμο. Αυτά τα νούμερα μιλούν για την δημοτικότητά του και τη χρησιμότητά του.

Κατά τη διάρκεια του περασμένου έτους, οι χρήστες βρήκαν όλους τους τύπους δημιουργικών τρόπων για να χρησιμοποιήσουν το ChatGPT, από απλές εργασίες όπως η γραφή email και η ενημέρωση βιογραφικών until την έναρξη επιτυχημένων επιχειρήσεων. Αλλά δεν είναι μόνο για το πώς οι άνθρωποι το χρησιμοποιούν, η τεχνολογία herself έχει μεγαλώσει και βελτιωθεί. Αρχικά, το ChatGPT ήταν μια δωρεάν υπηρεσία που προσφέρει λεπτομερείς κειμενικές απαντήσεις. Τώρα, υπάρχει το ChatGPT Plus, το οποίο περιλαμβάνει το ChatGPT-4. Αυτή η ενημερωμένη έκδοση έχει εκπαιδευτεί σε περισσότερα δεδομένα, δίνει λιγότερες λάθος απαντήσεις και καταλαβαίνει σύνθετες οδηγίες καλύτερα.

Μια από τις μεγαλύτερες ενημερώσεις είναι ότι το ChatGPT μπορεί τώρα να αλληλεπιδρά με πολλούς τρόπους – μπορεί να ακούσει, να μιλήσει και ακόμη να επεξεργαστεί εικόνες. Αυτό σημαίνει ότι μπορείτε να μιλήσετε μαζί του μέσω της εφαρμογής του και να του δείξετε εικόνες για να λάβετε απαντήσεις. Αυτές οι αλλαγές έχουν ανοίξει νέες δυνατότητες για τον AI και έχουν αλλάξει τον τρόπο που οι άνθρωποι βλέπουν και σκέφτονται για τον ρόλο του AI στη ζωή μας.

Από τις αρχές του ως ένα τεχνικό demo μέχρι την τρέχουσα κατάστασή του ως einem major player στην τεχνολογική σκηνή, το ταξίδι του ChatGPT είναι khá εντυπωσιακό. Αρχικά, θεωρήθηκε ως ένας τρόπος για να δοκιμάσει και να βελτιώσει την τεχνολογία με την λήψη σχολίων από το κοινό. Αλλά γρήγορα έγινε ένα απαραίτητο μέρος του τοπίου του AI. Αυτή η επιτυχία δείχνει πόσο αποτελεσματικό είναι να fine-tune μεγάλες γλωσσικές μοντέλα (LLMs) με και με την επιτήρηση του ανθρώπου. Jako αποτέλεσμα, το ChatGPT μπορεί να χειριστεί một ευρύ φάσμα ερωτήσεων και εργασιών.

Η διεκδίκηση για την ανάπτυξη των πιο ικανοποιητικών και ποικίλων συστημάτων AI έχει οδηγήσει σε eine πληθώρα ανοιχτών και ιδιόκτητων μοντέλων όπως το ChatGPT. Η κατανόηση των γενικών ικανοτήτων τους απαιτεί綜合적인 benchmarks σε ένα ευρύ φάσμα εργασιών. Αυτό το τμήμα εξετάζει αυτά τα benchmarks, ρίχνοντας φως σε тому πώς διαφορετικά μοντέλα, συμπεριλαμβανομένου του ChatGPT, συγκρίνονται μεταξύ τους.

Αξιολόγηση LLMs: Τα Benchmarks

MT-Bench: Αυτό το benchmark ελέγχει την ικανότητα του μοντέλου να ακολουθήσει οδηγίες και να συμμετάσχει σε διαλόγους σε οκτώ τομείς: γραφή, ρόλος, εξαγωγή πληροφοριών, συλλογισμός, μαθηματικά, κώδικας, επιστημονική γνώση και ανθρωπιστικές/κοινωνικές επιστήμες. Ισχυρότερα LLMs όπως το GPT-4 χρησιμοποιούνται ως αξιολογητές.
AlpacaEval: Βασισμένο στο σύνολο αξιολόγησης AlpacaFarm, αυτό το LLM-βασισμένο αυτόματο αξιολογητής αξιολογεί μοντέλα με βάση τις απαντήσεις από προηγμένα LLMs όπως το GPT-4 και το Claude, υπολογίζοντας το ποσοστό νίκης των υποψήφιων μοντέλων.
Ανοιχτό Leaderboard LLM: Χρησιμοποιώντας το Language Model Evaluation Harness, αυτό το leaderboard αξιολογεί LLMs σε επτά βασικά benchmarks, συμπεριλαμβανομένων προκλήσεων συλλογισμού και γενικής γνώσης, σε ρυθμίσεις zero-shot και few-shot.
BIG-bench: Αυτό το συνεργατικό benchmark καλύπτει πάνω από 200 νέες γλωσσικές εργασίες, που καλύπτουν μια ποικιλία θεμάτων και γλωσσών. Σκοπός του είναι να εξετάσει τις LLMs και να προβλέψει τις μελλοντικές ικανότητές τους.
ChatEval: Ένα πλαίσιο πολλαπλών πρακτόρων για συζήτηση που επιτρέπει σε ομάδες να συζητούν και να αξιολογούν την ποιότητα των απαντήσεων από διαφορετικά μοντέλα σε ανοιχτά ερωτήματα και παραδοσιακές εργασίες γενικής γλωσσικής παραγωγής.

Συγκριτική Απόδοση

Σε όρους γενικών benchmarks, τα ανοιχτά LLMs έχουν δείξει αξιοσημείωτη πρόοδο. Llama-2-70B, για παράδειγμα, πέτυχε εντυπωσιακά αποτελέσματα, ιδιαίτερα μετά τη fine-tuning με οδηγίες. Η παραλλαγή του, Llama-2-chat-70B, excelled στο AlpacaEval με ποσοστό νίκης 92,66%, υπερβαίνοντας το GPT-3.5-turbo. Ωστόσο, το GPT-4 παραμένει ο πρωταγωνιστής με ποσοστό νίκης 95,28%.

Zephyr-7B, ένα μικρότερο μοντέλο, επέδειξε ικανότητες συγκρίσιμες με μεγαλύτερα 70B LLMs, ιδιαίτερα στο AlpacaEval και MT-Bench. Εν τω μεταξύ, το WizardLM-70B, fine-tuned με μια ποικιλία οδηγιών, πέτυχε το υψηλότερο σκορ μεταξύ των ανοιχτών LLMs στο MT-Bench. Ωστόσο, vẫn lagged πίσω από το GPT-3.5-turbo και το GPT-4.

Μια ενδιαφέρουσα είσοδος, GodziLLa2-70B, πέτυχε ένα ανταγωνιστικό σκορ στο Open LLM Leaderboard, δείχνοντας το δυναμικό των πειραματικών μοντέλων που συνδυάζουν διαφορετικά σύνολα δεδομένων. Παρόμοια, το Yi-34B, αναπτυγμένο από την αρχή, ξεχώρισε με σκορ συγκρίσιμα με το GPT-3.5-turbo και μόνο ελαφρώς πίσω από το GPT-4.

UltraLlama, με τη fine-tuning σε διαφορετικά και υψηλής ποιότητας δεδομένα, matched το GPT-3.5-turbo στα προτεινόμενα benchmarks και sogar υπερέβηκε σε περιοχές γνώσης του κόσμου και επαγγελματικής γνώσης.

Αναβαθμίζοντας: Η Άνοδος των Γίγαντων LLMs

Top LLM models από το 2020

Μια αξιοσημείωτη τάση στην ανάπτυξη LLM έχει sido η αύξηση των παραμέτρων του μοντέλου. Μοντέλα όπως Gopher, GLaM, LaMDA, MT-NLG και PaLM έχουν推η την οριοθέτηση, φτάνοντας σε μοντέλα με μέχρι 540 δισεκατομμύρια παραμέτρους. Αυτά τα μοντέλα έχουν δείξει εξαιρετικές ικανότητες, αλλά η κλειστή φύση τους έχει περιορίσει την ευρύτερη εφαρμογή τους. Αυτό έχει σπείρει το ενδιαφέρον για την ανάπτυξη ανοιχτών LLMs, μια τάση που κερδίζει ορμή.

Παράλληλα με την αύξηση του μεγέθους των μοντέλων, οι ερευνητές έχουν εξετάσει εναλλακτικές στρατηγικές. Αντί να κάνουν τα μοντέλα μεγαλύτερα, έχουν επικεντρωθεί στην βελτίωση της προ-εκπαίδευσης των μικρότερων μοντέλων. Παραδείγματα περιλαμβάνουν Chinchilla και UL2, τα οποία έχουν δείξει ότι το περισσότερο δεν είναι πάντα καλύτερο, και ότι έξυπνες στρατηγικές μπορούν να οδηγήσουν σε αποτελεσματικά αποτελέσματα. Επιπλέον, υπάρχει σημαντική προσοχή στην οδηγία της εκπαίδευσης των γλωσσικών μοντέλων, με έργα όπως FLAN, T0 και Flan-T5 να συμβάλλουν σημαντικά σε αυτόν τον τομέα.

Ο Καταλύτης ChatGPT

Η εισαγωγή του ChatGPT από την OpenAI σημάδεψε ένα σημείο καμπής στην έρευνα NLP. Για να ανταγωνιστεί την OpenAI, εταιρείες όπως η Google και η Anthropic κυκλοφόρησαν τα δικά τους μοντέλα, Bard και Claude, αντίστοιχα. Ενώ αυτά τα μοντέλα δείχνουν συγκρίσιμη απόδοση με το ChatGPT σε πολλές εργασίες, vẫn παραμένουν πίσω από το τελευταίο μοντέλο της OpenAI, το GPT-4. Η επιτυχία αυτών των μοντέλων οφείλεται κυρίως στην τεχνική της ενίσχυσης της μάθησης από ανθρώπινη ανάδραση (RLHF), μια τεχνική που λαμβάνει αυξανόμενη έρευνα για περαιτέρω βελτίωση.

Φήμες και Εικασίες Γύρω από το Q* (Q-Star) της OpenAI

Πρόσφατες αναφορές δείχνουν ότι ερευνητές στην OpenAI μπορεί να έχουν επιτύχει μια σημαντική πρόοδο στον AI με την ανάπτυξη ενός νέου μοντέλου που ονομάζεται Q* (προφορά Q star). Κατάλογος, το Q* έχει την ικανότητα να εκτελεί μαθηματικές εργασίες σε επίπεδο δημοτικού, ένα κατόρθωμα που έχει σπάσει συζητήσεις μεταξύ εμπειρογνωμόνων για το δυναμικό του ως ορόσημο προς την τεχνητή γενική νοημοσύνη (AGI). Ενώ η OpenAI δεν έχει σχολιάσει αυτές τις αναφορές, οι φήμες για τις ικανότητες του Q* έχουν δημιουργήσει σημαντική ενθουσιασμό και εικασίες στα μέσα κοινωνικής δικτύωσης και μεταξύ των οπαδών του AI.

Η ανάπτυξη του Q* είναι αξιοσημείωτη επειδή τα υπάρχοντα γλωσσικά μοντέλα όπως το ChatGPT και το GPT-4, ενώ είναι ικανά για ορισμένες μαθηματικές εργασίες, δεν είναι ιδιαίτερα ικανά να τις χειριστούν αξιόπιστα. Η πρόκληση έγκειται στην ανάγκη για τα μοντέλα AI να αναγνωρίζουν nicht μόνο μοτίβα, όπως κάνουν τώρα μέσω του βαθύ μαθήματος και των μετασχηματιστών, αλλά και να συλλογίζονται και να καταλαβαίνουν αφηρημένες έννοιες. Τα μαθηματικά, ως ένα βENCHMARK για τη συλλογιστική, απαιτούν από το μοντέλο AI να σχεδιάσει και να εκτελέσει πολλαπλά βήματα, δείχνοντας μια βαθιά κατανόηση αφηρημένων εννοιών. Αυτή η ικανότητα θα σήμανε ένα σημαντικό άλμα στις ικανότητες του AI, πιθανότατα επεκτείνοντάς το πέρα από τα μαθηματικά σε άλλες σύνθετες εργασίες.

Ωστόσο, οι εμπειρογνώμονες προειδοποιούν κατά της υπερβολικής προβολής αυτής της ανάπτυξης. Ενώ ένα σύστημα AI που λύνει μαθηματικά προβλήματα με αξιόπιστο τρόπο θα ήταν ένα εντυπωσιακό κατόρθωμα, δεν σημαίνει απαραίτητα την έλευση του υπερ-ευφυούς AI ή της AGI. Η τρέχουσα έρευνα AI, συμπεριλαμβανομένων των προσπαθειών της OpenAI, έχει επικεντρωθεί σε στοιχειώδη προβλήματα, με ποικίλους βαθμούς επιτυχίας σε πιο σύνθετες εργασίες.

Οι πιθανές εφαρμογές των προόδων όπως το Q* είναι τεράστιες, φτάνοντας από την προσωποποιημένη διδασκαλία μέχρι τη βοήθεια στην επιστημονική έρευνα και μηχανική. Ωστόσο, είναι επίσης σημαντικό να διατηρούμε τις προσδοκίες και να αναγνωρίζουμε τις περιορισμούς και τις ανησυχίες ασφαλείας που σχετίζονται με τέτοιες προόδους. Οι ανησυχίες για τον AI που θέτει υπαρξιακούς κινδύνους, μια θεμελιώδη ανησυχία της OpenAI, παραμένουν σχετικές, ιδιαίτερα καθώς τα συστήματα AI αρχίζουν να αλληλεπιδρούν περισσότερο με τον πραγματικό κόσμο.

Το Κίνημα των Ανοιχτών LLMs

Για να ενισχύσει την έρευνα ανοιχτών LLMs, η Meta κυκλοφόρησε τα μοντέλα Llama, προκαλώντας μια νέα κυματοσειρά αναπτύξεων βασισμένων στο Llama. Αυτό περιλαμβάνει μοντέλα fine-tuned με οδηγίες, όπως Alpaca, Vicuna, Lima και WizardLM. Η έρευνα επίσης επεκτείνεται στην ενίσχυση των ικανοτήτων των πρακτόρων, της λογικής συλλογιστικής και της μοντελοποίησης μακράς περιόδου εντός του πλαισίου του Llama.

Επιπλέον, υπάρχει μια αυξανόμενη τάση ανάπτυξης ισχυρών LLMs από την αρχή, με έργα όπως MPT, Falcon, XGen, Phi, Baichuan, Mistral, Grok και Yi. Αυτές οι προσπάθειες αντανακλούν την αφοσίωση να δημοκρατικοποιήσουν τις ικανότητες των κλειστών LLMs, καθιστώντας τα προηγμένα εργαλεία AI πιο προσιτά και αποτελεσματικά.

Η Επίδραση του ChatGPT και των Ανοιχτών Μοντέλων στο Υγειονομικό Σύστημα

Βλέπουμε ένα μέλλον όπου τα LLMs βοηθούν στη λήψη κλινικών σημειώσεων, στη συμπλήρωση φορμών για αποζημιώσεις και στη υποστήριξη των γιατρών στη διάγνωση και στον σχεδιασμό θεραπείας. Αυτό έχει προσελκύσει την προσοχή τόσο των τεχνολογικών γιγάντων όσο και των ιδρυμάτων υγείας.

Οι συζητήσεις της Microsoft με την Epic, einen leading ηλεκτρονικούς προμηθευτή λογισμικού ιατρικών αρχείων, signal την ενσωμάτωση των LLMs στο υγειονομικό σύστημα. Πρωτοβουλίες είναι ήδη σε εξέλιξη στο UC San Diego Health και στο Stanford University Medical Center. Παρόμοια, οι συνεργασίες της Google με την Mayo Clinic και η εκκίνηση της Amazon Web Services του HealthScribe, μιας υπηρεσίας AI για κλινική τεκμηρίωση, σηματοδοτούν σημαντικά βήματα σε αυτήν την κατεύθυνση.

Ωστόσο, αυτές οι ταχείες αναπτύξεις ανεβάζουν ανησυχίες σχετικά με την παραχώρηση του ελέγχου της ιατρικής σε εταιρικά συμφέροντα. Η ιδιόκτητη φύση αυτών των LLMs τα καθιστά δύσκολο να αξιολογηθούν. Η πιθανή τροποποίηση ή διακοπή τους για λόγους κερδοφορίας θα μπορούσε να compromize την φροντίδα των ασθενών, την ιδιωτικότητα και την ασφάλεια.

Η επείγουσα ανάγκη είναι για μια ανοιχτή και συμπεριλαμβανόμενη προσέγγιση στην ανάπτυξη LLMs για το υγειονομικό σύστημα. Ιδρύματα υγείας, ερευνητές, κλινικοί γιατροί και ασθενείς πρέπει να συνεργαστούν παγκοσμίως για να xây dựng ανοιχτά LLMs για το υγειονομικό σύστημα. Αυτή η προσέγγιση, παρόμοια με το Trillion Parameter Consortium, θα επέτρεπε την汇集 των υπολογιστικών, οικονομικών πόρων και εμπειρογνωμοσύνης.

Aayush Mittal, Mittal

Έχω περάσει τα τελευταία πέντε χρόνια βυθισμένος στον συναρπαστικό κόσμο της Μηχανικής Μάθησης και του Βαθιάς Μάθησης. Η δέσμευσή μου και η εξειδίκευσή μου με οδήγησαν να συμβάλλω σε πάνω από 50 διαφορετικά projects μηχανικής λογισμικού, με ιδιαίτερη έμφαση στο AI/ML. Η συνεχής περιέργειά μου με έχει οδηγήσει επίσης προς την Επεξεργασία Φυσικής Γλώσσας, ένα πεδίο που είμαι πρόθυμος να εξερευνήσω περαιτέρω.