Моделі та платформи ШІ

RAFT – Файн-тюнінг та підхід RAG для домен-специфічного питання-відповіді

Опубліковано 29 березня 2024

Оновлено 22 травня 2026

Aayush Mittal Міттал

Як застосування великих мовних моделей розширюється до спеціалізованих доменів, необхідність ефективних і ефективних технік адаптації стає все більш важливою. З’являється RAFT (Retrieval Augmented Fine Tuning), новий підхід, який поєднує сильні сторони генерації з підтримкою пошукових запитів (RAG) і файн-тюнінгу, розроблений спеціально для завдань домен-специфічного питання-відповіді.

Виклик доменної адаптації

Хоча великі мовні моделі попередньо навчаються на величезних обсягах даних, їхня здатність добре виконувати завдання в спеціалізованих доменах, таких як медичні дослідження, юридичні документи або підприємницькі знання, часто обмежена. Це обмеження виникає через те, що дані попереднього навчання можуть не адекватно представляти нюанси і особливості цих спеціалізованих доменів. Для вирішення цієї проблеми дослідники традиційно застосовували два основних підходи: генерацію з підтримкою пошукових запитів (RAG) і файн-тюнінг.

Генерація з підтримкою пошукових запитів (RAG)

RAG

RAG – це техніка, яка дозволяє великим мовним моделям доступ і використання зовнішніх джерел знань під час інференсу.

Це досягається шляхом інтеграції реального часу пошукових запитів у процес генерації, що робить вивід моделі більш точним і актуальним. RAG складається з трьох основних кроків: пошуковий запит, де збираються відповідні документи; генерація, де модель створює вивід на основі отриманих даних; і доповнення, яке уточнює вивід далі.

Процес пошукового запиту в RAG починається з запиту користувача. Великі мовні моделі аналізують запит і збирають відповідну інформацію з зовнішніх баз даних, представляючи набір даних, з якого модель може витягнути інформацію для формування своїх відповідей. Фаза генерації синтезує цей вхід у кохерентну розповідь або відповідь. Крок доповнення уточнює генерацію, додаючи контекст або коригуючи за кохерентністю і актуальністю.

Моделі RAG можна оцінювати за допомогою різних метрик, оцінюючи їхню здатність надавати точну, актуальну і сучасну інформацію.

Файн-тюнінг

supervised-fine-tuning

Файн-тюнінг, з іншого боку,涉лює адаптацію попередньо навченої великої мовної моделі до конкретного завдання або домену шляхом подальшого навчання на меншому, завдань-специфічному наборі даних. Цей підхід дозволяє моделі вивчити закономірності і привести свої виводи у відповідність з бажаним завданням або доменом. Хоча файн-тюнінг може покращити виконання моделі, він часто не може ефективно включити зовнішні джерела знань або врахувати пошукові неточності під час інференсу.

Підхід RAFT

RAFT

RAFT (Retrieval-Aware Fine-Tuning) – це інноваційний метод навчання, розроблений для покращення виконання мовних моделей у домен-специфічних завданнях, особливо для відкритих книжкових питань-відповідей. RAFT відрізняється від стандартного файн-тюнінгу шляхом підготовки навчальних даних, які включають питання з сумішшю відповідних і невідповідних документів, а також ланцюгові пояснення, отримані з відповідних текстів. Цей метод спрямований на покращення здатності моделей не тільки nhớти інформацію, але і виводити висновки з контексту.

По суті, RAFT файн-тюнінг мовних моделей для виконання завдань, які включають читання і витягування інформації з набору документів. Навчання з “оракульними” документами (які містять відповідь) і “відволікальними” документами (які не містять відповіді) дозволяє моделі вивчити, коли слід покладатися на свою внутрішню інформацію (подібно до запам’ятовування) і коли витягувати інформацію з контексту.

Підготовка навчальних даних

Процес навчання під RAFT включає підготовку навчальних даних, які складаються з пропорції даних, що містять “оракульні” документи, які безпосередньо стосуються відповідей, тоді як решта даних складається тільки з “відволікальних” документів. Файн-тюнінг спонукає модель вивчити, коли слід покладатися на свою внутрішню інформацію (подібно до запам’ятовування) і коли витягувати інформацію з контексту.

Режим навчання RAFT також підкреслює генерацію процесів висновування, які не тільки допомагають у формуванні відповіді, але і цитують джерела, подібно до того, як людина виправдовує свою відповідь, посилаючись на матеріал, який вона прочитала. Цей підхід не тільки готує модель до середовища генерації з підтримкою пошукових запитів (RAG), де їй потрібно розглядати верхні k витягнутих документів, але також забезпечує незалежність навчання моделі від використовуваного пошукового модуля, дозволяючи гнучке застосування в різних пошукових системах.

Цей підхід служить декільком цілям:

Він навчає модель ідентифікувати і використовувати відповідну інформацію з контексту, імітуючи відкритий книжковий екзамен.
Він покращує здатність моделі ігнорувати невідповідну інформацію, критичний навик для ефективної генерації з підтримкою пошукових запитів.
Він знайомить модель зі сценаріями, в яких відповідь не присутня в контексті, спонукаючи її покладатися на свою власну інформацію, коли це необхідно.

Іншим ключовим аспектом RAFT є включення ланцюгових пояснень у процес навчання. Замість простого надання пар питань і відповідей, RAFT генерує детальні пояснення висновків, які включають цитати з відповідних документів. Ці пояснення, представлені у форматі ланцюга висновків, ведуть модель через логічні кроки, необхідні для отримання правильної відповіді.

Навчання моделі на цих ланцюгах висновків, RAFT спонукає розвиток сильних висновкових здібностей і покращує розуміння моделі того, як ефективно використовувати зовнішні джерела знань.

Оцінка і результати

Автори статті про RAFT провели широкі оцінки на різних наборах даних, включаючи PubMed (біомедичні дослідження), HotpotQA (відкриті питання-відповіді) і Gorilla APIBench (генерація коду). Їхні результати показали, що RAFT постійно перевершував базові моделі, такі як домен-специфічний файн-тюнінг з і без генерації з підтримкою пошукових запитів, а також більші моделі, такі як GPT-3.5 з генерацією з підтримкою пошукових запитів.

RAFT покращує виконання генерації з підтримкою пошукових запитів

Наприклад, на наборі даних HuggingFace RAFT досягнув точності 74%, що є суттєвим покращенням на 31,41% порівняно з домен-специфічним файн-тюнінгом (DSF) і на 44,92% порівняно з GPT-3.5 з генерацією з підтримкою пошукових запитів. Подібно, на наборі даних HotpotQA RAFT показав покращення точності на 28,9% порівняно з DSF.

Одним з ключових переваг RAFT є його стійкість до пошукових неточностей. Навчання моделі з сумішшю відповідних і невідповідних документів покращує здатність моделі розрізняти і пріоритезувати відповідну інформацію, навіть коли пошуковий модуль повертає субоптимальні результати.

Автори продемонстрували, що файн-тюнінг тільки з “оракульними” документами часто призводить до гіршої продуктивності порівняно з конфігураціями, які включають “відволікальні” документи. Це відкриття підкреслює важливість знайомства моделі з різними пошуковими сценаріями під час навчання, забезпечуючи її підготовленість до реальних застосунків.

Практичні застосування і майбутні напрямки

Техніка RAFT має суттєві наслідки для широкого спектра практичних застосунків, включаючи:

Системи питання-відповіді: RAFT можна використовувати для створення високоточних і домен-специфічних систем питання-відповіді, використовуючи як знання моделі, так і зовнішні джерела знань.
Управління знаннями підприємств: Організації з великими базами знань можуть використати RAFT для розробки спеціалізованих систем питання-відповіді, дозволяючи співробітникам швидко отримувати доступ і використовувати відповідну інформацію.
Медичні і наукові дослідження: RAFT може бути особливо цінним у доменах, таких як біомедичні дослідження, де доступ до останніх відкриттів і літератури є критично важливим для просування наукового розуміння.
Юридичні і фінансові послуги: RAFT може допомогти фахівцям цих галузей, надавши точні і контекстно-чутливі відповіді на основі відповідних юридичних документів або фінансових звітів.

По мірі продовження досліджень у цій галузі можна очікувати подальших удосконалень і розвитків техніки RAFT. Потенційні майбутні напрямки включають:

Дослідження більш ефективних і ефективних пошукових модулів, розроблених для конкретних доменів або структур документів.
Інтеграція багатомодальної інформації, такої як зображення або таблиці, у рамках RAFT для покращення розуміння контексту.
Розробка спеціалізованих архітектур висновування, які можуть краще використовувати ланцюгові пояснення, згенеровані під час навчання.
Адаптація RAFT до інших завдань природної мови, окрім питання-відповіді, таких як підсумовування, переклад або діалогові системи.

Висновок

RAFT представляє суттєвий крок вперед у сфері домен-специфічного питання-відповіді з мовними моделями. Об’єднуючи сильні сторони генерації з підтримкою пошукових запитів і файн-тюнінгу, RAFT забезпечує мовним моделям можливість ефективно використовувати зовнішні джерела знань, а також приводити свої виводи у відповідність з домен-специфічними закономірностями і перевагами.

Через інноваційну підготовку навчальних даних, включення ланцюгових пояснень і стійкість до пошукових неточностей, RAFT пропонує потужне рішення для організацій і дослідників, які шукають розблокувати весь потенціал мовних моделей у спеціалізованих доменах.

По мірі зростання попиту на домен-специфічні можливості обробки природної мови техніки, такі як RAFT, будуть відігравати ключову роль у забезпеченні більш точних, контекстно-чутливих і адаптивних мовних моделей, прокладаючи шлях до майбутнього, в якому спілкування людини і машини стане真正 безшовним і домен-агностичним.

Aayush Mittal, Міттал

Я провів останні п'ять років, занурючись у захопливий світ машинного навчання та глибокого навчання. Моя пристрасть та експертиза привели мене до внеску у понад 50 різних проектів програмної інженерії, з особливим акцентом на AI/ML. Моя тривала цікавість також привела мене до природної обробки мови, галузі, яку я бажаю дослідити далі.