Ηγέτες σκέψης
Θα Φέρει το GPT-4 τον Ανθρώπινο Κόσμο Κοντά σε μια Αληθινή Επανάσταση της Τεχνητής Νοημοσύνης;

Έχει περάσει σχεδόν τρία χρόνια από τότε που παρουσιάστηκε το GPT-3, τον Μάιο του 2020. Από τότε, το μοντέλο γεννήτριας κειμένου της τεχνητής νοημοσύνης έχει προκαλέσει μεγάλο ενδιαφέρον για την ικανότητά του να δημιουργεί κείμενο που μοιάζει και ακούγεται σαν να είχε γραφτεί από άνθρωπο. Τώρα φαίνεται ότι η επόμενη έκδοση του λογισμικού, GPT-4, είναι κοντά, με μια εκτιμώμενη ημερομηνία κυκλοφορίας κάποια στιγμή στις αρχές του 2023.
Παρά την高度 αναμενόμενη φύση αυτής της ειδήσεων της τεχνητής νοημοσύνης, οι ακριβείς λεπτομέρειες για το GPT-4 έχουν sido khá σκιώδεις. Η OpenAI, η εταιρεία πίσω από το GPT-4, δεν έχει δημοσιεύσει δημόσια πολλές πληροφορίες για το νέο μοντέλο, όπως τις λειτουργίες ή τις ικανότητές του. Παρόλα αυτά, οι πρόσφατες προόδους στο πεδίο της τεχνητής νοημοσύνης, ιδιαίτερα όσον αφορά την επεξεργασία φυσικής γλώσσας (NLP), μπορεί να προσφέρουν κάποιες ενδείξεις για το τι μπορούμε να περιμένουμε από το GPT-4.
Τι είναι το GPT;
Πριν να εισέλθουμε στις λεπτομέρειες, είναι χρήσιμο να καθορίσουμε πρώτα μια βάση για το τι είναι το GPT. Το GPT σημαίνει Γεννήτρια Προ-εκπαιδευμένη Μεταμορφωτή και αναφέρεται σε ένα μοντέλο νευρωνικού δικτύου βαθιάς μάθησης που έχει εκπαιδευτεί με δεδομένα από το διαδίκτυο για τη δημιουργία μεγάλων όγκων μηχανικής γεννήτριας κειμένου. Το GPT-3 είναι η τρίτη γενιά αυτής της τεχνολογίας και είναι ένα από τα πιο προηγμένα μοντέλα γεννήτριας κειμένου της τεχνητής νοημοσύνης που είναι διαθέσιμα σήμερα.
Σκεφτείτε το GPT-3 ως λειτουργία λίγο σαν τους βοηθούς φωνής, όπως η Siri ή η Alexa, μόνο σε πολύ μεγαλύτερη κλίμακα. Αντί να ζητήσετε από την Alexa να παίξει το αγαπημένο σας τραγούδι ή να ζητήσετε από τη Siri να γράψει το κείμενο σας, μπορείτε να ζητήσετε από το GPT-3 να γράψει ολόκληρο ένα eBook σε λίγα λεπτά ή να γεννήσει 100 ιδέες για κοινωνικά μέσα σε λιγότερο από ένα λεπτό. Όλο που χρειάζεται να κάνει ο χρήστης είναι να παρέχει μια προτροπή, όπως “Γράψτε μου ένα άρθρο 500 λέξεων για τη σημασία της δημιουργικότητας”. Όσο η προτροπή είναι σαφής και συγκεκριμένη, το GPT-3 μπορεί να γράψει σχεδόν οτιδήποτε σας ζητήσετε.
Από την κυκλοφορία του στο ευρύ κοινό, το GPT-3 έχει βρει πολλές επιχειρηματικές εφαρμογές. Οι εταιρείες το χρησιμοποιούν για περίληψη κειμένου, μετάφραση γλώσσας, γεννήτρια κώδικα και μεγάλης κλίμακας αυτοματοποίηση σχεδόν κάθε γραπτής εργασίας.
Είπαμε, ενώ το GPT-3 είναι αναμφισβήτητα πολύ εντυπωσιακό στην ικανότητά του να δημιουργεί highly readable ανθρώπινο-όμοιο κείμενο, είναι μακριά από το τέλειο. Προβλήματα τείνουν να εμφανιστούν όταν ζητηθεί να γράψει μεγαλύτερα κομμάτια, ιδιαίτερα όταν πρόκειται για σύνθετα θέματα που απαιτούν έμφαση. Για παράδειγμα, μια προτροπή να γεννήσει κώδικα υπολογιστή για einen ιστότοπο μπορεί να επιστρέψει σωστό αλλά υποβελτιστό κώδικα, οπότε ένας άνθρωπος-κωδικογράφος πρέπει ακόμη να μπει και να βελτιώσει. Είναι ένα παρόμοιο ζήτημα με τα μεγάλα έγγραφα κειμένου: όσο μεγαλύτερος ο όγκος του κειμένου, τόσο πιο πιθανό είναι ότι θα εμφανιστούν σφάλματα – đôiες φορές αστείες – που χρειάζονται διόρθωση από έναν άνθρωπο-συγγραφέα.
Απλά put, το GPT-3 δεν είναι μια πλήρης αντικατάσταση για ανθρώπινους συγγραφείς ή κωδικογράφους και δεν πρέπει να θεωρείται ως τέτοια. Αντίθετα, το GPT-3 πρέπει να θεωρείται ως ένας βοηθός γραφής, ένας που μπορεί να σώσει τους ανθρώπους πολύ χρόνο όταν χρειάζονται να γεννήσουν ιδέες για blog ή περίληψη για διαφημιστικό κείμενο ή δελτία τύπου.
Περισσότερα παραμέτρους = καλύτερα;
Ένα πράγμα να κατανοηθεί για τα μοντέλα της τεχνητής νοημοσύνης είναι πώς χρησιμοποιούν παραμέτρους για να κάνουν προβλέψεις. Οι παραμέτρους ενός μοντέλου της τεχνητής νοημοσύνης ορίζουν τη διαδικασία μάθησης και παρέχουν δομή για την έξοδο. Ο αριθμός παραμέτρων σε ένα μοντέλο της τεχνητής νοημοσύνης έχει γενικά χρησιμοποιηθεί ως μέτρο απόδοσης. Όσο περισσότερες παραμέτρους, τόσο πιο ισχυρό, ομαλό και προβλέψιμο είναι το μοντέλο, τουλάχιστον σύμφωνα με την υπόθεση κλιμάκωσης.
Για παράδειγμα, όταν κυκλοφόρησε το GPT-1 το 2018, είχε 117 εκατομμύρια παραμέτρους. Το GPT-2, που κυκλοφόρησε ένα χρόνο αργότερα, είχε 1,2 δισεκατομμύρια παραμέτρους, ενώ το GPT-3 αυξήθηκε τον αριθμό ακόμη υψηλότερα σε 175 δισεκατομμύρια παραμέτρους. Σύμφωνα με μια συνέντευξη του Αυγούστου 2021 με Wired, ο Andrew Feldman, ιδρυτής και διευθύνων σύμβουλος της Cerebras, einer εταιρείας που συνεργάζεται με την OpenAI, ανέφερε ότι το GPT-4 θα είχε περίπου 100 τρισεκατομμύρια παραμέτρους. Αυτό θα έκανε το GPT-4 100 φορές πιο ισχυρό από το GPT-3, ένα κβαντικό άλμα στην大小 των παραμέτρων που, κατανοητά, έχει κάνει πολλούς ανθρώπους πολύ ενθουσιασμένους.
Ωστόσο, παρά την υψηλή αξίωση του Feldman, υπάρχουν καλές λόγοι για να πιστεύουμε ότι το GPT-4 δεν θα έχει στην πραγματικότητα 100 τρισεκατομμύρια παραμέτρους. Όσο μεγαλύτερος ο αριθμός των παραμέτρων, τόσο πιο ακριβό γίνεται το μοντέλο να εκπαιδευτεί και να tinh chỉnh λόγω των τεράστιων ποσοτήτων υπολογιστικής δύναμης που απαιτούνται.
Πλέον, υπάρχουν περισσότεροι παράγοντες από τον αριθμό των παραμέτρων που καθορίζουν την αποτελεσματικότητα ενός μοντέλου. Πάρτε για παράδειγμα Megatron-Turing NLG, ένα μοντέλο γεννήτριας κειμένου που κατασκευάστηκε από την Nvidia και τη Microsoft, το οποίο έχει περισσότερες από 500 δισεκατομμύρια παραμέτρους. Παρά το μέγεθός του, το MT-NLG δεν έρχεται κοντά στο GPT-3 όσον αφορά την απόδοση. Σε σύντομη, μεγαλύτερο δεν σημαίνει απαραίτητα καλύτερο.
Είναι πιθανό ότι το GPT-4 θα έχει περισσότερες παραμέτρους από το GPT-3, αλλά παραμένει να δούμε αν ο αριθμός θα είναι μια τάξη μεγέθους υψηλότερος. Αντίθετα, υπάρχουν άλλες ενδιαφέρουσες δυνατότητες που η OpenAI πιθανότατα ακολουθεί, όπως ένα λεπτότερο μοντέλο που επικεντρώνεται σε ποιοτικές βελτιώσεις στο σχεδιασμό αλγορίθμου και συμμόρφωσης. Η ακριβής επίδραση τέτοιων βελτιώσεων είναι δύσκολο να προβλεφθεί, αλλά αυτό που είναι γνωστό είναι ότι ένα σπάνιο μοντέλο μπορεί να μειώσει τους υπολογιστικούς κόστους μέσω της условной υπολογισμού, δηλαδή, όχι όλες οι παραμέτρους στο μοντέλο της τεχνητής νοημοσύνης θα είναι ενεργές όλα ταυτόχρονα, που είναι παρόμοιο με τον τρόπο που λειτουργούν οι νευρώνες στον ανθρώπινο εγκέφαλο.
Τι θα μπορεί να κάνει το GPT-4;
Μέχρι η OpenAI να βγάλει μια νέα δήλωση ή ακόμη και να κυκλοφορήσει το GPT-4, μας μένει να.speculate πώς θα διαφέρει από το GPT-3. Παρόλα αυτά, μπορούμε να κάνουμε κάποιες προβλέψεις
Αν και το μέλλον της ανάπτυξης της τεχνητής νοημοσύνης είναι πολυμορφικό, το GPT-4 πιθανότατα θα παραμείνει μόνο κείμενο. Jako άνθρωποι, ζούμε σε ένα πολυαισθητικό κόσμο που είναι γεμάτος με διαφορετικά ήχη, οπτικά και κειμενικά ερεθίσματα. Επομένως, είναι αναπόφευκτο ότι η ανάπτυξη της τεχνητής νοημοσύνης θα παραγάγει τελικά ένα πολυμορφικό μοντέλο που μπορεί να ενσωματώσει eine ποικιλία εισόδων.
Ωστόσο, ένα καλό πολυμορφικό μοντέλο είναι σημαντικά πιο δύσκολο να σχεδιαστεί από ένα μοντέλο μόνο κειμένου. Η τεχνολογία δεν είναι ακόμη εκεί και με βάση ό,τι ξέρουμε για τους περιορισμούς του μεγέθους των παραμέτρων, είναι πιθανό ότι η OpenAI επικεντρώνεται στην επέκταση και την βελτίωση ενός μοντέλου μόνο κειμένου.
Είναι επίσης πιθανό ότι το GPT-4 θα είναι λιγότερο εξαρτημένο από την ακριβή προτροπή. Một από τα μειονεκτήματα του GPT-3 είναι ότι οι προτροπές κειμένου πρέπει να γραφτούν με προσοχή για να λάβετε το αποτέλεσμα που θέλετε. Όταν οι προτροπές δεν γραφτούν με προσοχή, μπορείτε να λάβετε εξόδους που είναι ψευδείς, τοξικές ή ακόμη και να αντανακλούν εξτρεμιστικές απόψεις. Αυτό είναι μέρος του που είναι γνωστό ως “προβλήμα συμμόρφωσης” και αναφέρεται σε προκλήματα στη δημιουργία ενός μοντέλου της τεχνητής νοημοσύνης που κατανοεί πλήρως τις προθέσεις του χρήστη. Με άλλα λόγια, το μοντέλο της τεχνητής νοημοσύνης δεν είναι συμμορφωμένο με τους στόχους ή τις προθέσεις του χρήστη.既然 τα μοντέλα της τεχνητής νοημοσύνης έχουν εκπαιδευτεί με datasets κειμένου από το διαδίκτυο, είναι πολύ εύκολο για τις ανθρώπινες προκαταλήψεις, ψευδείς και προκαταλήψεις να βρουν τον δρόμο τους στο κείμενο εξόδου.
Είπαμε, υπάρχουν καλές λόγοι για να πιστεύουμε ότι οι développers κάνουν πρόοδο στο πρόβλημα συμμόρφωσης. Αυτή η αισιοδοξία προέρχεται από κάποιες прорυθμίσεις στην ανάπτυξη του InstructGPT, μιας πιο προηγμένης έκδοσης του GPT-3 που έχει εκπαιδευτεί με ανθρώπινη ανάδραση για να ακολουθήσει οδηγίες και προθέσεις χρήστη πιο στενά.
Ωστόσο, πρέπει να σημειωθεί ότι αυτές οι δοκιμές διεξήχθησαν μόνο με υπαλλήλους της OpenAI, μια σχετικά ομοιογενής ομάδα που μπορεί να μην διαφέρει πολύ σε φύλο, θρησκεία ή πολιτικές απόψεις. Είναι πιθανό ότι το GPT-4 θα υποβληθεί σε πιο ποικιλόμορφη εκπαίδευση που θα βελτιώσει τη συμμόρφωση για διαφορετικές ομάδες, αν και σε ποιο βαθμό παραμένει να δούμε.
Θα αντικαταστήσει το GPT-4 τους ανθρώπους;
Παρά την υπόσχεση του GPT-4, είναι απίθανο ότι θα αντικαταστήσει πλήρως την ανάγκη για ανθρώπινους συγγραφείς και κωδικογράφους. Υπάρχει ακόμη πολύ δουλειά να γίνει σε όλα, από την βελτίωση παραμέτρων έως την πολυμορφικότητα και τη συμμόρφωση. Μπορεί να περάσουν πολλά χρόνια trước να δούμε einen γεννήτρια κειμένου που μπορεί να επιτύχει μια πραγματικά ανθρώπινη κατανόηση των复잡ностей και των νюανς της πραγματικής εμπειρίας.
Είπαμε, υπάρχουν ακόμη καλές λόγοι για να είναι ενθουσιασμένοι για την έλευση του GPT-4. Η βελτίωση παραμέτρων – και όχι απλά η αύξηση των παραμέτρων – θα οδηγήσει πιθανότατα σε ένα μοντέλο της τεχνητής νοημοσύνης που έχει πολύ περισσότερη υπολογιστική δύναμη από τον προκάτοχό του. Και η βελτιωμένη συμμόρφωση θα κάνει πιθανότατα το GPT-4 πολύ πιο φιλικό προς τον χρήστη.
Επιπλέον, βρισκόμαστε ακόμη μόνο στην αρχή της ανάπτυξης και της υιοθέτησης των εργαλείων της τεχνητής νοημοσύνης. Περισσότερες χρήσεις για την τεχνολογία βρίσκονται συνεχώς, και καθώς οι άνθρωποι κερδίζουν περισσότερη εμπιστοσύνη και άνεση με τη χρήση της τεχνητής νοημοσύνης στην εργασία, είναι σχεδόν βέβαιο ότι θα δούμε ευρεία υιοθέτηση των εργαλείων της τεχνητής νοημοσύνης σε σχεδόν κάθε επιχειρηματικό τομέα τα επόμενα χρόνια.












