Connect with us

Αντιμετωπίζοντας Τρέχοντα Ζητήματα Μέσα στα LLMs & Προσβλέποντας στο Τί Είναι το Επόμενο

Ηγέτες σκέψης

Αντιμετωπίζοντας Τρέχοντα Ζητήματα Μέσα στα LLMs & Προσβλέποντας στο Τί Είναι το Επόμενο

mm

Σήμερα, υπάρχουν δεκάδες δημόσια διαθέσιμα μεγάλα μοντέλα γλώσσας (LLMs), όπως το GPT-3, GPT-4, LaMDA, ή Bard, και ο αριθμός αυξάνεται συνεχώς καθώς κυκλοφορούν νέα μοντέλα. Τα LLMs έχουν επανακατασκευάσει την τεχνητή νοημοσύνη, αλλάζοντας πλήρως τον τρόπο με τον οποίο αλληλεπιδρούμε με την τεχνολογία σε διάφορους τομείς. Αυτά τα μοντέλα μας επιτρέπουν να μαθαίνουμε από πολλά σύνολα δεδομένων ανθρώπινης γλώσσας και έχουν ανοίξει νέους δρόμους για καινοτομία, δημιουργικότητα και αποδοτικότητα.

Ωστόσο, με μεγάλη δύναμη έρχεται μεγάλη复雑η. Υπάρχουν εγγενείς προκλήσεις και ηθικά ζητήματα που περιβάλλουν τα LLMs που πρέπει να αντιμετωπιστούν πριν μπορούμε να τα χρησιμοποιήσουμε στο μέγιστο του δυναμικού τους. Για παράδειγμα, μια πρόσφατη μελέτη του Stanford βρήκε ρατσιστικές και φυλετικές προκαταλήψεις όταν παρατηρήθηκε το ChatGPT-4 για το πώς αντιμετωπίζει ορισμένες ερωτήσεις που περιλαμβάνουν ονόματα που υποδηλώνουν φυλή ή φύλο. Σε αυτή τη μελέτη, το πρόγραμμα ζητήθηκε να δώσει συμβουλές για το πόσο πρέπει να πληρώσει κανείς για ένα χρησιμοποιημένο ποδήλατο που πουλιέται από κάποιον με το όνομα Jamal Washington, το οποίο είχε ως αποτέλεσμα πολύ χαμηλότερο ποσό, σε σύγκριση με όταν ο πωλητής ονομάζονταν Logan Becker. Όσο αυτά τα ευρήματα συνεχίζουν να έρχονται στο φως, η ανάγκη να αντιμετωπιστούν οι προκλήσεις των LLMs αυξάνεται.

Πώς να Μειώσετε τα Συνηθισμένα Προβλήματα των LLM

Προκατάληψη

Ένα από τα πιο συχνά συζητιζόμενα ζητήματα μεταξύ των LLMs είναι η προκατάληψη και η δίκαιη αντιμετώπιση. Σε μια πρόσφατη μελέτη, ειδικοί έκαναν τον έλεγχο τεσσάρων πρόσφατα δημοσιευμένων LLMs και βρήκαν ότι όλα εξέφραζαν προκαταλήψεις σχετικά με τους άνδρες και τις γυναίκες, ιδιαίτερα αυτές που συναδέλφωναν με τις αντιλήψεις των ανθρώπων παρά με αυτές που βασίζονταν στη πραγματικότητα. Σε αυτό το контέκστ, η προκατάληψη αναφέρεται στην άνιση αντιμετώπιση ή αποτελέσματα μεταξύ διαφορετικών κοινωνικών ομάδων, πιθανότατα λόγω ιστορικών ή δομικών ανισοτήτων εξουσίας.

Στα LLMs, η προκατάληψη οφείλεται στην επιλογή δεδομένων, τη δημογραφία των δημιουργών και τη στρέβλωση γλώσσας ή πολιτισμού. Η προκατάληψη στην επιλογή δεδομένων συμβαίνει όταν τα κείμενα που επιλέγονται για την εκπαίδευση των LLMs δεν αντιπροσωπεύουν την πλήρη ποικιλία της γλώσσας που χρησιμοποιείται στο διαδίκτυο. Τα LLMs που εκπαιδεύονται σε εκτενείς αλλά περιορισμένους συνόλους δεδομένων peuvent κληρονομούν τις προκαταλήψεις που ήδη υπάρχουν σε αυτά τα κείμενα. Με τη δημογραφία των δημιουργών, ορισμένες δημογραφικές ομάδες突出 περισσότερο συχνά από άλλες, το οποίο υπογραμμίζει την ανάγκη για περισσότερη ποικιλία και εναρμονισμό στο περιεχόμενο για να μειώσει την προκατάληψη. Για παράδειγμα, η Βικιπαίδεια, μια κοινή πηγή δεδομένων εκπαίδευσης, παρουσιάζει μια αξιοσημείωτη δημογραφική ανισορροπία μεταξύ των συντακτών της με πλειοψηφία ανδρών ( 84% ). Αυτό είναι παρόμοιο με τη στρέβλωση που βρίσκεται για γλώσσα και πολιτισμό. Πολλές πηγές που τα LLMs εκπαιδεύονται σε είναι στρεβλωμένες, με English-κεντρική προοπτική, η οποία μεταφράζεται μόνο μερικές φορές ακριβώς σε άλλες γλώσσες και πολιτισμούς.

Είναι απαραίτητο τα LLMs να εκπαιδεύονται σε φιλτράρισμένα δεδομένα και να υπάρχουν φραγμοί για να καταστέλλουν θέματα που δεν είναι συνεπή αντιπροσωπήσεις των δεδομένων. Ένας τρόπος για να το κάνετε αυτό είναι μέσω τεχνικών βασισμένων στην επέκταση δεδομένων. Μπορείτε να προσθέσετε παραδείγματα από υποαντιπροσωπεύουσες ομάδες στα δεδομένα εκπαίδευσης, ετσι ώστε να διευρύνετε την ποικιλία του συνόλου δεδομένων. Một άλλη στρατηγική μείωσης είναι η φιλτράρισή και η επαναζύγισή των δεδομένων, η οποία εστιάζει κυρίως στην ακριβή στόχευση συγκεκριμένων, υποαντιπροσωπεύουσων παραδειγμάτων μέσα σε ένα υπάρχον σύνολο δεδομένων.

Οπτασία

Μέσα στο контέκστ των LLMs, η οπτασία είναι ένα φαινόμενο που χαρακτηρίζεται από την παραγωγή κειμένου που, ενώ είναι γραμματικά σωστό και φαίνεται συνεπές, απομακρύνεται από την фактиτική ακρίβεια ή την πρόθεση του αρχικού υλικού. Πράγματι, πρόσφατες αναφορές έχουν βρει ότι μια αγωγή για einen νόμο του Minnesota επηρεάζεται trực tiếp από τις οπτασίες των LLMs. Ένα έγγραφο που υποβεβληθηκε για να υποστηρίξει τον νόμο έχει βρεθεί να περιλαμβάνει μη υπαρκτά πηγές που μπορεί να είχαν οπταθεί από το ChatGPT ή ένα άλλο LLM. Αυτές οι οπτασίες μπορούν εύκολα να μειώσουν την αξιοπιστία ενός LLM.

Υπάρχουν τρεις κύριες μορφές οπτασίων:

  1. Οπτασία που ανταγωνίζεται την Εισαγωγή: Αυτό συμβαίνει όταν η έξοδος ενός LLM απομακρύνεται από την εισαγωγή του χρήστη, η οποία συνήθως περιλαμβάνει οδηγίες εργασιών και το πραγματικό περιεχόμενο που πρέπει να επεξεργαστεί.
  2. Οπτασία που ανταγωνίζεται το Κοντέκστ: Τα LLMs μπορεί να παράγουν εσωτερικά ασυνεπή απαντήσεις σε σενάρια που περιλαμβάνουν επεκτάσεις διαλόγου ή πολλές ανταλλαγές. Αυτό υποδηλώνει μια πιθανή ανεπάρκεια στην ικανότητα του μοντέλου να παρακολουθεί το контέκστ ή να διατηρεί συνάφεια σε διάφορες αλληλεπιδράσεις.
  3. Οπτασία που ανταγωνίζεται τα Fakta: Αυτή η μορφή οπτασίας προκύπτει όταν ένα LLM παράγει περιεχόμενο που ανταγωνίζεται την καθιερωμένη фактиκή γνώση. Οι απαρχές τέτοιων λαθών είναι ποικίλες και μπορεί να συμβούν σε διάφορα στάδια του κύκλου ζωής ενός LLM.

Πολλά παράγοντες έχουν συντελέσει σε αυτό το φαινόμενο, όπως ελλείψεις γνώσης, που εξηγούν πώς τα LLMs μπορεί να λείπουν της γνώσης ή της ικανότητας να αφομοιώσουν σωστά τις πληροφορίες κατά την προ-εκπαίδευση. Επιπλέον, η προκατάληψη μέσα στα δεδομένα εκπαίδευσης ή μια στρατηγική σειριακής γεννήσεως των LLMs, που ονομάζεται “οπτασίες χιόνι”, μπορεί να δημιουργήσει οπτασίες.

Υπάρχουν τρόποι να μειώσετε τις οπτασίες, αν και θα είναι πάντα ένα χαρακτηριστικό των LLMs. Βοηθητικές στρατηγικές για την μείωση των οπτασίων είναι η μείωση κατά την προ-εκπαίδευση (χέρι-βελτίωση δεδομένων με τεχνικές φιλτραρίσματος) ή την εκπαίδευση (επιμέλεια δεδομένων εκπαίδευσης). Ωστόσο, η μείωση κατά την εύρεση είναι η καλύτερη λύση λόγω της κοστολογικής της αποτελεσματικότητας και ελέγχου.

Ιδιωτικότητα

Με την άνοδο του διαδικτύου, η αυξημένη προσβασιμότητα των προσωπικών πληροφοριών και άλλων ιδιωτικών δεδομένων έχει γίνει ένα ευρέως αναγνωρισμένο ζήτημα. Μια μελέτη βρήκε ότι 80% των Αμερικανών καταναλωτών φοβούνται ότι τα δεδομένα τους χρησιμοποιούνται για την εκπαίδευση μοντέλων AI.既然 τα πιο nổi bật LLMs προέρχονται από ιστοσελίδες, πρέπει να λάβουμε υπόψη μας πώς αυτό θέτει κινδύνους ιδιωτικότητας και παραμένει ένα σε μεγάλο βαθμό ανεπίλυτο πρόβλημα για τα LLMs.

Ο πιο απλός τρόπος για να αποτρέψετε τα LLMs από το να διανέμουν προσωπικές πληροφορίες είναι να τις αφαιρέσετε από τα δεδομένα εκπαίδευσης. Ωστόσο, δεδομένου του τεράστιου όγκου δεδομένων που εμπλέκονται στα LLMs, είναι σχεδόν αδύνατο να εγγυηθούμε ότι όλες οι προσωπικές πληροφορίες έχουν εξαφανιστεί. Μια άλλη κοινή εναλλακτική λύση για τις οργανώσεις που βασίζονται σε εξωτερικά αναπτυγμένα μοντέλα είναι να επιλέξουν ένα ανοιχτό LLM αντί για μια υπηρεσία όπως το ChatGPT.

Με αυτήν την προσέγγιση, μπορείτε να αναπτύξετε μια αντίγραφο του μοντέλου εσωτερικά. Οι προτροπές των χρηστών παραμένουν ασφαλείς μέσα στο δίκτυο της οργάνωσης και δεν εκτίθενται σε υπηρεσίες τρίτων. Αν και αυτό μειώνει δραματικά τον κίνδυνο διαρροής ευαίσθητων δεδομένων, προστίθεται επίσης σημαντική πολυπλοκότητα. Δεδομένου των δυσκολιών να εγγυηθούμε πλήρως την προστασία των ιδιωτικών δεδομένων, είναι ακόμη ζωτικό για τους dévelopers εφαρμογών να λάβουν υπόψη τους πώς αυτά τα μοντέλα μπορούν να θέσουν τους χρήστες τους σε κίνδυνο.

Το Επόμενο Σύνορο για τα LLMs

Όσο συνεχίζουμε να μεγαλώνουμε και να διαμορφώνουμε τις επόμενες εξελίξεις των LLMs μέσω της μείωσης των τρεχόντων κινδύνων, πρέπει να περιμένουμε την επανάσταση των LLM agents, τα οποία ήδη βλέπουμε εταιρείες όπως H με Runner H, αρχίζοντας να κυκλοφορούν. Η μετάβαση από τα καθαρά μοντέλα γλώσσας σε αρχιτεκτονικές agents αντιπροσωπεύει μια αλλαγή στη σχεδίαση συστημάτων AI. Η βιομηχανία θα κινηθεί πέρα από τις εγγενείς περιορισμούς των διεπαφών συνομιλίας και της απλής αναπαραγωγής-ενισχυμένης γεννήσεως. Αυτά τα νέα πλαίσια agents θα έχουν εξελιγμένα μοντέλα σχεδιασμού που διασπάουν σύνθετα αντικείμενα σε ατομικά υπο-εργασίες, διατηρούν επεισοδιακή μνήμη για контέκστ λογικής και αξιοποιούν εξειδικευμένα εργαλεία μέσω καλά καθορισμένων API. Αυτό δημιουργεί μια πιο ροβούστα προσέγγιση για την αυτοματοποίηση εργασιών.

Εκτός από τα LLMs, θα υπάρξει μεγαλύτερη εστίαση στην εκπαίδευση μικρότερων μοντέλων γλώσσας λόγω της κοστολογικής τους αποτελεσματικότητας, της προσβασιμότητας και της ευκολίας ανάπτυξής τους. Για παράδειγμα, τα μοντέλα γλώσσας που εξειδικεύονται σε συγκεκριμένα πεδία ή βιομηχανίες. Αυτά τα μοντέλα είναι λεπτομερώς ρυθμισμένα με δεδομένα και ορολογία που εξειδικεύονται σε συγκεκριμένα πεδία, καθιστώντας τα ιδανικά για σύνθετα και ρυθμιζόμενα περιβάλλοντα, όπως το ιατρικό ή το νομικό πεδίο, όπου η ακρίβεια είναι απαραίτητη. Αυτή η στοχευμένη προσέγγιση μειώνει την πιθανότητα λαθών και οπτασίων που γενικά μοντέλα μπορεί να παράγουν όταν αντιμετωπίζουν εξειδικευμένο περιεχόμενο.

Όσο συνεχίζουμε να εξερευνούμε νέα σύνορα στα LLMs, είναι απαραίτητο να ωθήσουμε τα όρια της καινοτομίας και να αντιμετωπίσουμε και να μετριάσουμε τους πιθανούς κινδύνους που σχετίζονται με την ανάπτυξή τους και την ανάπτυξή τους. Μόνο αντιμετωπίζοντας πρώτα και προληπτικά τις προκλήσεις που σχετίζονται με την προκατάληψη, τις οπτασίες και την ιδιωτικότητα μπορούμε να δημιουργήσουμε μια πιο ροβούστα βάση για τα LLMs να ευδοκιμήσουν σε διάφορους τομείς.

Ο Uday Kamath είναι ο Chief Analytics Officer στο Smarsh, τον παγκόσμιο ηγέτη στις επικοινωνίες δεδομένων και ευφυΐα. Ο ρόλος του περιλαμβάνει την πρωτοβουλία της επιστήμης των δεδομένων και της έρευνας στην συνομιλητική AI. Με πάνω από 25 χρόνια εμπειρίας στην αναλυτική ανάπτυξη και διδακτορικό στην κλιμακώσιμη μηχανική μάθηση, οι σημαντικές συνεισφορές του Kamath εκτείνονται σε πολλά περιοδικά, συνέδρια, βιβλία και διπλώματα ευρεσιτεχνίας. Είναι επίσης ενεργό μέλος του Διοικητικού Συμβουλίου Συμβούλων για οντότητες, συμπεριλαμβανομένων εμπορικών εταιρειών όπως η Falkonry και ακαδημαϊκών ιδρυμάτων όπως το Κέντρο Ανθρώπινης-Μηχανικής Συνεργασίας στο GMU.