стуб РАФТ – Фино подешавање и РАГ приступ одговарању на питања специфична за домен - Уните.АИ
Повежите се са нама

Вештачка интелигенција

РАФТ – Фино подешавање и РАГ приступ давању одговора на питања специфична за домен

mm
Ажурирано on

Како се примене великих језичких модела шире у специјализоване домене, потреба за ефикасним и ефективним техникама прилагођавања постаје све важнија. Унесите РАФТ (Ретриевал Аугментед Фине Тунинг), нови приступ који комбинује предности генерисања са проширеним проналажењем (РАГ) и финог подешавања, посебно скројеног за задатке одговарања на питања специфичне за домен.

Изазов адаптације домена

Док су ЛЛМ претходно обучени за огромне количине података, њихова способност да добро раде у специјализованим доменима, као што су медицинска истраживања, правна документација или базе знања специфичне за предузећа, често је ограничена. Ово ограничење настаје зато што подаци пре обуке можда не представљају на адекватан начин нијансе и замршености ових специјализованих домена. Да би се суочили са овим изазовом, истраживачи су традиционално користили две главне технике: генерацију са проширеним проналажењем (РАГ) и фино подешавање.

Проширено генерисање (РАГ)

РАГ

РАГ

РАГ је техника која омогућава ЛЛМс да приступи и користи екстерне изворе знања током закључивања.

То постиже интеграцијом преузимања података у реалном времену у генеративни процес, чинећи на тај начин излазе модела тачнијим и ажурнијим. РАГ се састоји од три основна корака: проналажење, где се прикупљају релевантни документи; генерисање, где модел производи излаз на основу преузетих података; и повећање, које додатно оплемењује излаз.

Процес преузимања у РАГ-у почиње упитом корисника. ЛЛМ анализирају упит и преузимају релевантне информације из екстерних база података, представљајући скуп података из којих модел може да извуче да би формулисао своје одговоре. Фаза генерисања затим синтетише овај унос у кохерентну причу или одговор. Корак повећања оплемењује генерацију додавањем контекста или прилагођавањем кохерентности и релевантности.

РАГ модели се могу проценити коришћењем различитих метрика, процењујући њихову способност да пруже тачне, релевантне и ажурне информације.

Фино подешавање

надзирано фино подешавање

надзирано фино подешавање

Фино подешавање, са друге стране, укључује прилагођавање унапред обученог ЛЛМ-а на одређени задатак или домен тако што га даље обучава на мањем скупу података специфичном за задатак. Овај приступ омогућава моделу да научи обрасце и усклади своје излазе са жељеним задатком или доменом. Иако фино подешавање може побољшати перформансе модела, оно често не успева да ефикасно укључи екстерне изворе знања или не узме у обзир несавршености у проналажењу током закључивања.

РАФТ приступ

СПЛАВ

СПЛАВ

СПЛАВ што представља фино подешавање са свешћу преузимања, иновативна је метода обуке прилагођена језичким моделима како би се побољшао њихов учинак у задацима специфичним за домен, посебно за испите отворене књиге. РАФТ одступа од стандардног финог подешавања припремајући податке о обуци који укључују питања са мешавином релевантних и нерелевантних докумената, заједно са одговорима у стилу ланца размишљања изведеним из релевантних текстова. Овај метод има за циљ да побољша способности модела не само да се присете информација већ и да размисле и извуку одговоре из понуђеног садржаја.

У суштини, РАФТ фино подешава језичке моделе како би био вештији у задацима који укључују разумевање читања и извлачење знања из скупа докумената. Обуком са документима „пророчанства“ (који садрже одговор) и документима „дистрактора“ (који не садрже), модел учи да разазнаје и ефикасније користи релевантне информације.

Припрема података за обуку

Процес обуке у оквиру РАФТ-а укључује део података који садржи документе пророчанства који се директно односе на одговоре, док се преостали подаци састоје само од докумената који ометају. Фино подешавање подстиче модел да научи када да се ослони на своје интерно знање (слично памћењу) и када да извуче информације из датог контекста.

РАФТ-ов режим обуке такође наглашава генерисање процеса закључивања, који не само да помажу у формирању одговора, већ и цитирају изворе, слично као што би човек оправдао свој одговор позивајући се на материјал који је прочитао. Овај приступ не само да припрема модел за РАГ (Ретриевал Аугментед Генератион) поставку где мора да узме у обзир топ-к преузете документе, већ такође обезбеђује да обука модела буде независна од коришћеног ретривера, омогућавајући флексибилну примену у различитим системима за преузимање.

Овај приступ служи вишеструким сврхама:

  1. Он обучава модел да идентификује и користи релевантне информације из датог контекста, опонашајући поставку испита за отворену књигу.
  2. Побољшава способност модела да занемари небитне информације, што је критична вештина за ефикасан РАГ.
  3. Она излаже модел сценаријима у којима одговор није присутан у контексту, охрабрујући га да се ослони на сопствено знање када је то потребно.

Други кључни аспект РАФТ-а је укључивање ланца размишљања у процес обуке. Уместо једноставног пружања парова питања и одговора, РАФТ генерише детаљна образложења која укључују дословне цитате из релевантних докумената. Ова објашњења, представљена у облику ланца мисли, воде модел кроз логичке кораке потребне да би се дошао до тачног одговора.

Обучавајући модел на овим ланцима расуђивања, РАФТ подстиче развој јаких способности расуђивања и побољшава разумевање модела о томе како ефикасно искористити екстерне изворе знања.

Евалуација и резултати

Аутори РАФТ документа су спровели опсежне евалуације различитих скупова података, укључујући ПубМед (биомедицинско истраживање), ХотпотКА (одговарање на питања отвореног домена) и Горилла АПИБенцх (генерисање кода). Њихови резултати су показали да је РАФТ доследно надмашио основне линије, као што је фино подешавање специфично за домен са и без РАГ-а, као и веће моделе као што је ГПТ-3.5 са РАГ-ом.

РАФТ побољшава перформансе РАГ-а

РАФТ побољшава перформансе РАГ-а

На пример, на скупу података ХуггингФаце, РАФТ је постигао тачност од 74%, значајно побољшање од 31.41% у односу на фино подешавање специфично за домен (ДСФ) и 44.92% у односу на ГПТ-3.5 са РАГ-ом. Слично томе, на скупу података ХотпотКА, РАФТ је показао повећање тачности од 28.9% у поређењу са ДСФ-ом.

Једна од кључних предности РАФТ-а је његова отпорност на проналажење несавршености. Обучавајући модел са мешавином релевантних и нерелевантних докумената, РАФТ побољшава способност модела да препозна и одреди приоритете релевантних информација, чак и када модул за проналажење даје субоптималне резултате.

Аутори су показали да фино подешавање само са документима пророчанства често доводи до лошијих перформанси у поређењу са конфигурацијама које укључују документе који одвлаче пажњу. Овај налаз наглашава важност излагања модела различитим сценаријима преузимања током обуке, обезбеђујући његову спремност за примене у стварном свету.

Практичне примене и будући правци

РАФТ техника има значајне импликације за широк спектар практичних примена, укључујући:

  1. Системи за одговарање на питања: РАФТ се може користити за изградњу веома тачних и специфичних система за одговарање на питања, користећи и научено знање модела и екстерне изворе знања.
  2. Управљање знањем предузећа: Организације са великим базама знања могу искористити РАФТ да развију прилагођене системе за одговарање на питања, омогућавајући запосленима да брзо приступе и користе релевантне информације.
  3. Медицинска и научна истраживања: РАФТ може бити посебно вредан у доменима као што су биомедицинска истраживања, где је приступ најновијим налазима и литератури од кључног значаја за унапређење научног разумевања.
  4. Правне и финансијске услуге: РАФТ може помоћи професионалцима у овим областима пружањем тачних одговора који су свесни контекста на основу релевантних правних докумената или финансијских извештаја.

Како се истраживања у овој области настављају, можемо очекивати даља унапређења и усавршавања РАФТ технике. Потенцијални будући правци укључују:

  1. Истраживање ефикаснијих и ефективнијих модула за проналажење, прилагођених специфичним доменима или структурама докумената.
  2. Интеграција мултимодалних информација, као што су слике или табеле, у РАФТ оквир за боље разумевање контекста.
  3. Развој специјализованих архитектура резоновања које могу боље искористити објашњења ланца мишљења која се стварају током обуке.
  4. Прилагођавање РАФТ-а другим задацима на природном језику осим одговора на питања, као што су резимирање, превођење или системи дијалога.

Zakljucak

РАФТ представља значајан искорак у области одговарања на питања специфична за домен помоћу језичких модела. Хармоничним спајањем снага проширене генерације и финог подешавања, РАФТ опрема ЛЛМ-ове способношћу да ефикасно искористе екстерне изворе знања, истовремено усклађујући своје резултате са обрасцима и преференцијама специфичним за домен.

Кроз своје иновативно курирање података о обуци, инкорпорацију ланца размишљања и робусност на проналажење несавршености, РАФТ нуди моћно решење за организације и истраживаче који желе да откључају пуни потенцијал ЛЛМ-а у специјализованим доменима.

Како потражња за могућностима обраде природног језика специфичних за домен наставља да расте, технике као што је РАФТ ће играти кључну улогу у омогућавању прецизнијих, контекстуално свесних и прилагодљивих језичких модела, утирући пут за будућност у којој комуникација између човека и машине постаје заиста беспрекорно и независно од домена.

Провео сам последњих пет година урањајући се у фасцинантан свет машинског учења и дубоког учења. Моја страст и стручност довели су ме до тога да допринесем преко 50 различитих пројеката софтверског инжењеринга, са посебним фокусом на АИ/МЛ. Моја стална радозналост ме је такође привукла ка обради природног језика, пољу које желим даље да истражујем.