Τεχνητή νοημοσύνη

RAFT – Μια Προσέγγιση για την Ενίσχυση της Ταιριαστικής και της RAG για Ερωτήσεις σε Ειδικούς Τομείς

Published March 29, 2024

Updated April 27, 2026

Aayush Mittal Mittal

Καθώς οι εφαρμογές των μεγάλων μοντέλων γλώσσας επεκτείνονται σε εξειδικευμένους τομείς, η ανάγκη για αποτελεσματικές και αποτελεσματικές τεχνικές προσαρμογής γίνεται ολοένα και πιο κρίσιμη. Εισάγετε το RAFT (Retrieval Augmented Fine Tuning), μια νέα προσέγγιση που συνδυάζει τις ιδρυτικές του retrieval-augmented generation (RAG) και της ταιριαστικής, ειδικά για εργασίες ερωτήσεων σε ειδικούς τομείς.

Η Πρόκληση της Προσαρμογής του Τομέα

Ενώ τα LLMs προ-εκπαιδεύονται σε τεράστιες ποσότητες δεδομένων, η ικανότητά τους να εκτελούν καλά σε εξειδικευμένους τομείς, όπως η ιατρική έρευνα, η νομική τεκμηρίωση ή οι γνώσεις της επιχείρησης, συχνά είναι περιορισμένη. Αυτό το περιορισμό οφείλεται στο ότι τα δεδομένα προ-εκπαίδευσης μπορεί να μην αντιπροσωπεύουν επαρκώς τις νουανσές και τις ιδιαιτερότητες αυτών των εξειδικευμένων τομέων. Για να αντιμετωπίσουν αυτή την πρόκληση, οι ερευνητές έχουν παραδοσιακά χρησιμοποιήσει δύο основικές τεχνικές: την RAG και την ταιριαστική.

Retrieval-Augmented Generation (RAG)

RAG

RAG είναι μια τεχνική που επιτρέπει στα LLMs να έχουν πρόσβαση και να χρησιμοποιούν εξωτερικές πηγές γνώσεων κατά τη διάρκεια της ερμηνείας.

Αchieves αυτό ενσωματώνοντας την ανάκτηση δεδομένων σε πραγματικό χρόνο στη διαδικασία γενεσιουργών, καθιστώντας τις εξόδους του μοντέλου πιο ακριβείς και ενημερωμένες. Η RAG αποτελείται από τρία βασικά βήματα: ανάκτηση, όπου συλλέγονται σχετικά έγγραφα, γενεσιουργία, όπου το μοντέλο παράγει μια έξοδο με βάση τα ανακτημένα δεδομένα και ενίσχυση, η οποία βελτιώνει την έξοδο περαιτέρω.

Η διαδικασία ανάκτησης στη RAG ξεκινά με μια ερώτηση του χρήστη. Τα LLMs αναλύουν την ερώτηση και ανακτούν σχετικές πληροφορίες από εξωτερικές βάσεις δεδομένων, παρουσιάζοντας μια πηγή δεδομένων από την οποία το μοντέλο μπορεί να αντλήσει για να διαμορφώσει τις απαντήσεις του. Η φάση γενεσιουργίας συνθέτει αυτή την είσοδο σε μια συνεκτική αφήγηση ή απάντηση. Το βήμα ενίσχυσης βελτιώνει τη γενεσιουργία προσθέτοντας контέκστ ή điều chỉnh για συνάφεια και σχετικότητα.

Τα μοντέλα RAG μπορούν να αξιολογηθούν χρησιμοποιώντας eine ποικιλία μετρικών, αξιολογώντας την ικανότητά τους να παρέχουν ακριβείς, σχετικές και ενημερωμένες πληροφορίες.

Ταιριαστική

supervised-fine-tuning

Ταιριαστική, από την άλλη πλευρά, περιλαμβάνει την προσαρμογή ενός προ-εκπαιδευμένου LLM σε μια συγκεκριμένη εργασία ή τομέα με περαιτέρω εκπαίδευση σε ένα μικρότερο, εργασία-ειδικό σύνολο δεδομένων. Αυτή η προσέγγιση επιτρέπει στο μοντέλο να μάθει μοτίβα και να ευθυγραμμίσει τις εξόδους του με την επιθυμητή εργασία ή τομέα. Ενώ η ταιριαστική μπορεί να βελτιώσει την απόδοση του μοντέλου, συχνά αποτυγχάνει να ενσωματώσει αποτελεσματικά εξωτερικές πηγές γνώσεων ή να λάβει υπόψη τις ατέλειες ανάκτησης κατά τη διάρκεια της ερμηνείας.

Η Προσέγγιση RAFT

RAFT

RAFT standing για Retrieval-Aware Fine-Tuning, είναι μια καινοτόμος μέθοδος εκπαίδευσης που προορίζεται για γλωσσικά μοντέλα για να βελτιώσουν την απόδοσή τους σε εργασίες ειδικών τομέων, ιδιαίτερα για ανοιχτά βιβλία εξετάσεων. Το RAFT διαφέρει από την τυπική ταιριαστική με την προετοιμασία εκπαιδευτικών δεδομένων που περιλαμβάνει ερωτήσεις με μια смесь σχετικών και μη-σχετικών εγγράφων, μαζί με απαντήσεις τύπου chain-of-thought που προέρχονται από τα σχετικά κείμενα. Αυτή η μέθοδος έχει ως στόχο να βελτιώσει τις ικανότητες των μοντέλων να θυμόντουσαν όχι μόνο πληροφορίες αλλά και να εξαγώνουν και να παραγάγουν απαντήσεις από το παρεχόμενο περιεχόμενο.

Στην ουσιαστική του, το RAFT ταιριάζει τα γλωσσικά μοντέλα για να είναι πιο ικανά σε εργασίες που περιλαμβάνουν ανάγνωση και εξαγωγή γνώσεων από ένα σύνολο εγγράφων. Με την εκπαίδευση και με “oracle” εγγράφων (τα οποία περιέχουν την απάντηση) και “distractor” εγγράφων (τα οποία δεν περιέχουν), το μοντέλο μαθαίνει να διακρίνει και να χρησιμοποιεί αποτελεσματικά τις σχετικές πληροφορίες.

Προετοιμασία Εκπαιδευτικών Δεδομένων

Η διαδικασία εκπαίδευσης του RAFT περιλαμβάνει ένα ποσοστό των δεδομένων να περιέχει “oracle” εγγράφων που σχετίζονται άμεσα με τις απαντήσεις, ενώ τα υπόλοιπα δεδομένα αποτελούνται μόνο από “distractor” εγγράφων. Η ταιριαστική ενθαρρύνει το μοντέλο να μάθει πότε να βασίζεται στη δική του γνώση (όμοια με τη μνήμη) και πότε να εξαγάγει πληροφορίες από το контέκστ που παρέχεται.

Η διαδικασία εκπαίδευσης του RAFT τόνιζε επίσης τη γενεσιουργία διαδικασιών σκέψης, οι οποίες όχι μόνο βοηθούν στη διαμόρφωση της απάντησης αλλά και να αναφέρουν πηγές, παρόμοια με τον τρόπο που ένας άνθρωπος θα δικαιολογούσε την απάντησή του αναφερόμενος στο υλικό που έχει διαβάσει. Αυτή η προσέγγιση όχι μόνο προετοιμάζει το μοντέλο για μια RAG (Retrieval Augmented Generation) ρύθμιση όπου πρέπει να λάβει υπόψη τα top-k ανακτημένα έγγραφα αλλά cũng εξασφαλίζει ότι η εκπαίδευση του μοντέλου είναι ανεξάρτητη από το retriever που χρησιμοποιείται, επιτρέποντας έτσι την ευέλικτη εφαρμογή σε διαφορετικά συστήματα ανάκτησης.

Αυτή η προσέγγιση εξυπηρετεί πολλαπλούς σκοπούς:

Εκπαιδεύει το μοντέλο να αναγνωρίζει και να χρησιμοποιεί σχετικές πληροφορίες από το παρεχόμενο контέκστ, μιμούμενος την ρύθμιση ανοιχτού βιβλίου εξετάσεων.
Βελτιώνει την ικανότητα του μοντέλου να αγνοεί μη-σχετικές πληροφορίες, μια κρίσιμη ικανότητα για αποτελεσματική RAG.
Εξθέτει το μοντέλο σε σενάρια όπου η απάντηση δεν είναι παρόντα στο контέκστ, ενθαρρύνοντας το να βασίζεται στη δική του γνώση όταν είναι απαραίτητο.

Ένα άλλο κρίσιμο σημείο του RAFT είναι η ενσωμάτωση της σκέψης αλυσίδας-σκέψης στη διαδικασία εκπαίδευσης. Αντί να παρέχει απλώς την ερώτηση και την απάντηση, το RAFT γενείλετε λεπτομερείς εξηγήσεις σκέψης που περιλαμβάνουν εύγλωττες αναφορές από τα σχετικά έγγραφα. Αυτές οι εξηγήσεις, παρουσιαζόμενες σε μορφή αλυσίδας-σκέψης, οδηγούν το μοντέλο μέσα από τα λογικά βήματα που απαιτούνται για να φθάσουν στην σωστή απάντηση.

Με την εκπαίδευση του μοντέλου σε αυτές τις αλυσίδες σκέψης, το RAFT ενθαρρύνει την ανάπτυξη ισχυρών ικανοτήτων σκέψης και βελτιώνει την κατανόηση του μοντέλου για το πώς να χρησιμοποιήσει αποτελεσματικά τις εξωτερικές πηγές γνώσεων.

Αξιολόγηση και Αποτελέσματα

Οι συγγραφείς του RAFT διεξήγαγαν εκτεταμένες αξιολογήσεις σε διάφορα σύνολα δεδομένων, συμπεριλαμβανομένων PubMed (βιοϊατρική έρευνα), HotpotQA (ανοιχτή ερώτηση-απάντηση) και Gorilla APIBench (γενεσιουργία κώδικα). Τα αποτελέσματά τους έδειξαν ότι το RAFT υπερέβη συνεχώς τα baselines, όπως η ταιριαστική σε ειδικούς τομείς με και χωρίς RAG, καθώς και μεγαλύτερα μοντέλα όπως το GPT-3.5 με RAG.

RAFT improves RAG performance

Για παράδειγμα, στο σύνολο δεδομένων HuggingFace, το RAFT έφτασε σε ακρίβεια 74%, μια σημαντική βελτίωση 31.41% πάνω από την ταιριαστική σε ειδικούς τομείς (DSF) και 44.92% πάνω από το GPT-3.5 με RAG. Παρόμοια, στο σύνολο δεδομένων HotpotQA, το RAFT παρουσίασε μια αύξηση ακρίβειας 28.9% σε σύγκριση με την DSF.

Ένα από τα κύρια πλεονεκτήματα του RAFT είναι η ανθεκτικότητά του στις ατέλειες ανάκτησης. Με την εκπαίδευση του μοντέλου με μια смесь σχετικών και μη-σχετικών εγγράφων, το RAFT βελτιώνει την ικανότητα του μοντέλου να διακρίνει και να προτεραιοποιεί τις σχετικές πληροφορίες, ακόμη και όταν το μοντέλο ανάκτησης επιστρέφει υποβέλτιστες απαντήσεις.

Οι συγγραφείς έδειξαν ότι η ταιριαστική μόνο με τα “oracle” εγγράφων συχνά οδηγεί σε κατώτερη απόδοση σε σύγκριση με τις ρυθμίσεις που περιλαμβάνουν “distractor” εγγράφων. Αυτό το εύρημα υπογραμμίζει τη σημασία της έκθεσης του μοντέλου σε διάφορες ρυθμίσεις ανάκτησης κατά τη διάρκεια της εκπαίδευσης, εξασφαλίζοντας την προετοιμασία του για πραγματικές εφαρμογές.

Πρακτικές Εφαρμογές και Μελλοντικές Κατευθύνσεις

Η τεχνική RAFT έχει σημαντικές επιπτώσεις για eine σειρά από πρακτικές εφαρμογές, συμπεριλαμβανομένων:

Συστήματα Ερωτήσεων-Απαντήσεων: Το RAFT μπορεί να χρησιμοποιηθεί για να κατασκευαστούν ακριβή και ειδικά συστήματα ερωτήσεων-απαντήσεων, αξιοποιώντας τόσο τη γνώση που έχει μάθει το μοντέλο όσο και τις εξωτερικές πηγές γνώσεων.
Διαχείριση Γνώσεων Επιχείρησης: Οι οργανισμοί με μεγάλες βάσεις γνώσεων μπορούν να αξιοποιήσουν το RAFT για να αναπτύξουν εξειδικευμένα συστήματα ερωτήσεων-απαντήσεων, επιτρέποντας στους υπαλλήλους να έχουν γρήγορη πρόσβαση και να χρησιμοποιούν σχετικές πληροφορίες.
Ιατρική και Επιστημονική Έρευνα: Το RAFT μπορεί να είναι ιδιαίτερα χρήσιμο σε τομείς όπως η βιοϊατρική έρευνα, όπου η πρόσβαση στις τελευταίες ερευνητικές εργασίες και στη βιβλιογραφία είναι κρίσιμη για την πρόοδο της επιστημονικής κατανόησης.
Νομικές και Χρηματοοικονομικές Υπηρεσίες: Το RAFT μπορεί να βοηθήσει τους επαγγελματίες σε αυτούς τους τομείς παρέχοντας ακριβείς και контέκστ-ευαίσθητες απαντήσεις με βάση σχετικά νομικά έγγραφα ή χρηματοοικονομικές αναφορές.

Καθώς η έρευνα σε αυτόν τον τομέα συνεχίζεται, μπορούμε να περιμένουμε περαιτέρω προόδους και βελτιώσεις στην τεχνική RAFT. Πιθανές μελλοντικές κατευθύνσεις περιλαμβάνουν:

Εξέταση πιο αποτελεσματικών και αποτελεσματικών μοντέλων ανάκτησης, προσαρμοσμένων για συγκεκριμένους τομείς ή δομές εγγράφων.
Ενσωμάτωση πολλαπλών μονών πληροφοριών, όπως εικόνες ή πίνακες, στο πλαίσιο του RAFT για ενισχυμένη κατανόηση του контέκστ.
Ανάπτυξη εξειδικευμένων αρχιτεκτονικών σκέψης που μπορούν να αξιοποιήσουν καλύτερα τις αλυσίδες-σκέψης που παράγονται κατά τη διάρκεια της εκπαίδευσης.
Προσαρμογή του RAFT σε άλλες φυσικές γλώσσες πέρα από τις ερωτήσεις-απαντήσεις, όπως η περίληψη, η μετάφραση ή τα συστήματα διαλόγου.

Συμπέρασμα

Το RAFT αντιπροσωπεύει ένα σημαντικό βήμα προς τα εμπρός στον τομέα της ερωτήσεων-απαντήσεων σε ειδικούς τομείς με γλωσσικά μοντέλα. Με την αρμονική σύντηξη των ιδρυτικών της RAG και της ταιριαστικής, το RAFT εξοπλίζει τα LLMs με την ικανότητα να αξιοποιούν αποτελεσματικά τις εξωτερικές πηγές γνώσεων ενώ ταυτόχρονα ευθυγραμμίζουν τις εξόδους τους με τις προτιμήσεις και τα μοτίβα του τομέα.

Μέσω της καινοτόμου προετοιμασίας των εκπαιδευτικών δεδομένων, της ενσωμάτωσης της αλυσίδας-σκέψης και της ανθεκτικότητας στις ατέλειες ανάκτησης, το RAFT προσφέρει μια ισχυρή λύση για οργανισμούς και ερευνητές που αναζητούν να ξεκλειδώσουν το πλήρες δυναμικό των LLMs σε εξειδικευμένους τομείς.

Καθώς η ζήτηση για ικανότητες επεξεργασίας φυσικής γλώσσας σε ειδικούς τομείς συνεχίζει να αυξάνεται, τεχνικές όπως το RAFT θα παίξουν einen κρίσιμο ρόλο στην ενεργοποίηση πιο ακριβών, контέκστ-ευαίσθητων και προσαρμοστικών γλωσσικών μοντέλων, ανοίγοντας τον δρόμο για ένα μέλλον όπου η επικοινωνία ανθρώπου-μηχανής θα γίνει πραγματικά ομαλή και ανεξάρτητη του τομέα.

Aayush Mittal

Έχω περάσει τα τελευταία πέντε χρόνια βυθισμένος στον fascinující κόσμο της Μηχανικής Μάθησης και της Βαθιάς Μάθησης. Η αγάπη και η εξειδίκευσή μου έχουν οδηγήσει στην συμβολή μου σε πάνω από 50 διαφορετικά projects μηχανικής λογισμικού, με ιδιαίτερη έμφαση στο AI/ML. Η συνεχής περιέργεια μου έχει επίσης τραβήξει την προσοχή μου προς την Επεξεργασία Φυσικής Γλώσσας, ένα πεδίο που είμαι πρόθυμος να εξερευνήσω περαιτέρω.