எங்களை தொடர்பு கொள்ளுங்கள்

செயற்கை நுண்ணறிவு

RAFT - டொமைன்-குறிப்பிட்ட கேள்விக்கான பதிலுக்கான ஒரு சிறந்த-டியூனிங் மற்றும் RAG அணுகுமுறை

mm
புதுப்பிக்கப்பட்ட on

பெரிய மொழி மாதிரிகளின் பயன்பாடுகள் சிறப்புக் களங்களாக விரிவடைவதால், திறமையான மற்றும் பயனுள்ள தழுவல் நுட்பங்களின் தேவை பெருகிய முறையில் முக்கியமானது. RAFT (Retrieval Augmented Fine Tuning) ஐ உள்ளிடவும், இது மீட்டெடுப்பு-ஆக்மென்டட் ஜெனரேஷன் (RAG) மற்றும் ஃபைன்-ட்யூனிங் ஆகியவற்றின் வலிமையை ஒருங்கிணைக்கும் ஒரு புதுமையான அணுகுமுறையாகும், இது குறிப்பாக டொமைன்-குறிப்பிட்ட கேள்விகளுக்கு பதிலளிக்கும் பணிகளுக்காக வடிவமைக்கப்பட்டுள்ளது.

டொமைன் தழுவலின் சவால்

LLMகள் பரந்த அளவிலான தரவுகளில் முன் பயிற்சி பெற்றிருந்தாலும், மருத்துவ ஆராய்ச்சி, சட்ட ஆவணங்கள் அல்லது நிறுவன-குறிப்பிட்ட அறிவுத் தளங்கள் போன்ற சிறப்புக் களங்களில் சிறப்பாகச் செயல்படும் திறன் பெரும்பாலும் குறைவாகவே இருக்கும். பயிற்சிக்கு முந்தைய தரவு, இந்த சிறப்புக் களங்களின் நுணுக்கங்களையும் நுணுக்கங்களையும் போதுமான அளவில் பிரதிநிதித்துவப்படுத்தாததால், இந்த வரம்பு எழுகிறது. இந்த சவாலை எதிர்கொள்ள, ஆராய்ச்சியாளர்கள் பாரம்பரியமாக இரண்டு முக்கிய நுட்பங்களைப் பயன்படுத்துகின்றனர்: மீட்டெடுப்பு-ஆக்மென்ட் ஜெனரேஷன் (RAG) மற்றும் ஃபைன்-ட்யூனிங்.

மீட்டெடுப்பு-ஆக்மென்ட் ஜெனரேஷன் (RAG)

RAG

RAG

RAG செயல்படுத்தும் ஒரு நுட்பமாகும் எல்எல்எம்கள் அனுமானத்தின் போது வெளிப்புற அறிவு ஆதாரங்களை அணுகவும் பயன்படுத்தவும்.

இது நிகழ்நேர தரவு மீட்டெடுப்பை உருவாக்கும் செயல்முறையில் ஒருங்கிணைப்பதன் மூலம் இதை அடைகிறது, இதனால் மாதிரியின் வெளியீடுகளை மிகவும் துல்லியமாகவும் புதுப்பித்ததாகவும் ஆக்குகிறது. RAG மூன்று முக்கிய படிகளைக் கொண்டுள்ளது: மீட்டெடுப்பு, அங்கு தொடர்புடைய ஆவணங்கள் சேகரிக்கப்படுகின்றன; தலைமுறை, அங்கு மாதிரி மீட்டெடுக்கப்பட்ட தரவின் அடிப்படையில் ஒரு வெளியீட்டை உருவாக்குகிறது; மற்றும் பெருக்குதல், இது வெளியீட்டை மேலும் செம்மைப்படுத்துகிறது.

RAG இல் மீட்டெடுக்கும் செயல்முறை பயனரின் வினவலுடன் தொடங்குகிறது. LLMகள் வினவலை பகுப்பாய்வு செய்து, வெளிப்புற தரவுத்தளங்களிலிருந்து பொருத்தமான தகவலைப் பெறுகின்றன, மாதிரியானது அதன் பதில்களை உருவாக்கக்கூடிய தரவுகளின் தொகுப்பை வழங்குகிறது. தலைமுறை கட்டமானது இந்த உள்ளீட்டை ஒரு ஒத்திசைவான கதை அல்லது பதிலில் ஒருங்கிணைக்கிறது. பெருக்குதல் படியானது சூழலைச் சேர்ப்பதன் மூலம் தலைமுறையைச் செம்மைப்படுத்துகிறது அல்லது ஒத்திசைவு மற்றும் பொருத்தத்திற்காக சரிசெய்கிறது.

RAG மாதிரிகள் பல்வேறு அளவீடுகளைப் பயன்படுத்தி மதிப்பீடு செய்யப்படலாம், துல்லியமான, பொருத்தமான மற்றும் புதுப்பித்த தகவலை வழங்குவதற்கான அவற்றின் திறனை மதிப்பிடுகின்றன.

நன்றாக மெருகேற்றுவது

மேற்பார்வையிடப்பட்ட-நன்றாக-சரிசெய்தல்

மேற்பார்வையிடப்பட்ட-நன்றாக-சரிசெய்தல்

நன்றாக மெருகேற்றுவது, மறுபுறம், ஒரு சிறிய, பணி சார்ந்த தரவுத்தொகுப்பில் மேலும் பயிற்சியளிப்பதன் மூலம் ஒரு குறிப்பிட்ட பணி அல்லது டொமைனுக்கு முன்-பயிற்சி பெற்ற LLM ஐ மாற்றியமைப்பது அடங்கும். இந்த அணுகுமுறை மாதிரியை வடிவங்களைக் கற்றுக்கொள்ளவும் அதன் வெளியீடுகளை விரும்பிய பணி அல்லது டொமைனுடன் சீரமைக்கவும் அனுமதிக்கிறது. ஃபைன்-ட்யூனிங் மாதிரியின் செயல்திறனை மேம்படுத்தும் அதே வேளையில், இது பெரும்பாலும் வெளிப்புற அறிவு ஆதாரங்களை திறம்பட இணைக்கத் தவறிவிடும் அல்லது அனுமானத்தின் போது மீட்டெடுப்பு குறைபாடுகளை கணக்கில் எடுத்துக்கொள்கிறது.

RAFT அணுகுமுறை

ராஃப்ட்

ராஃப்ட்

ராஃப்ட் Retrieval-Aware Fine-Tuning க்கு நிற்கிறது, இது ஒரு புதுமையான பயிற்சி முறையாகும், இது மொழி மாதிரிகள் டொமைன்-குறிப்பிட்ட பணிகளில், குறிப்பாக திறந்த புத்தகத் தேர்வுகளில் அவற்றின் செயல்திறனை மேம்படுத்துவதற்காக வடிவமைக்கப்பட்டுள்ளது. RAFT ஆனது, பயிற்சித் தரவைத் தயாரிப்பதன் மூலம், தொடர்புடைய மற்றும் சம்பந்தமில்லாத ஆவணங்களின் கலவையுடன், தொடர்புடைய உரைகளிலிருந்து பெறப்பட்ட சிந்தனை பாணியிலான பதில்களுடன், பயிற்சித் தரவைத் தயாரிக்கிறது. இந்த முறையானது, மாடல்களின் திறன்களை மேம்படுத்துவதை நோக்கமாகக் கொண்டுள்ளது, மேலும் தகவலை நினைவுபடுத்துவது மட்டுமல்லாமல், வழங்கப்பட்ட உள்ளடக்கத்திலிருந்து பகுத்தறிவு மற்றும் பதில்களைப் பெறவும் செய்கிறது.

சாராம்சத்தில், RAFT மொழி மாதிரிகளை நன்றாகப் புரிந்துகொள்வது மற்றும் ஆவணங்களின் தொகுப்பிலிருந்து அறிவைப் பிரித்தெடுப்பதை உள்ளடக்கிய பணிகளில் மிகவும் திறமையானதாக இருக்கும். "ஆரக்கிள்" ஆவணங்கள் (பதிலைக் கொண்டவை) மற்றும் "திசை திசைதிருப்பும்" ஆவணங்கள் (அவை இல்லை) ஆகிய இரண்டிலும் பயிற்சியளிப்பதன் மூலம், மாதிரியானது தொடர்புடைய தகவலை மிகவும் திறம்பட கண்டறிந்து பயன்படுத்த கற்றுக்கொள்கிறது.

பயிற்சி தரவு தயாரித்தல்

RAFT இன் கீழ் உள்ள பயிற்சி செயல்முறையானது, பதில்களுடன் நேரடியாக தொடர்புடைய ஆரக்கிள் ஆவணங்களைக் கொண்ட தரவின் விகிதத்தை உள்ளடக்கியது, மீதமுள்ள தரவு திசைதிருப்பும் ஆவணங்களை மட்டுமே கொண்டுள்ளது. நேர்த்தியான டியூனிங் மாதிரியானது அதன் உள் அறிவை (மனப்பாடம் செய்வது போன்றது) மற்றும் வழங்கப்பட்ட சூழலில் இருந்து எப்போது தகவலைப் பிரித்தெடுக்க வேண்டும் என்பதை அறிய ஊக்குவிக்கிறது.

RAFT இன் பயிற்சி முறையானது பகுத்தறிவு செயல்முறைகளின் தலைமுறையை வலியுறுத்துகிறது, இது பதிலை உருவாக்குவதில் உதவுவது மட்டுமல்லாமல் ஆதாரங்களை மேற்கோள் காட்டவும் உதவுகிறது. இந்த அணுகுமுறையானது, டாப்-கே மீட்டெடுக்கப்பட்ட ஆவணங்களைக் கருத்தில் கொள்ள வேண்டிய RAG (மீட்டெடுக்கப்பட்ட ஆக்மென்ட் ஜெனரேஷன்) அமைப்பிற்கான மாதிரியைத் தயாரிப்பது மட்டுமல்லாமல், மாதிரியின் பயிற்சியானது பயன்படுத்தப்பட்ட மீட்டெடுப்பிலிருந்து சுயாதீனமாக இருப்பதை உறுதிசெய்கிறது, இது வெவ்வேறு மீட்டெடுப்பு அமைப்புகளில் நெகிழ்வான பயன்பாட்டை அனுமதிக்கிறது.

இந்த அணுகுமுறை பல நோக்கங்களுக்காக உதவுகிறது:

  1. திறந்த புத்தகத் தேர்வு அமைப்பைப் பிரதிபலிக்கும் வகையில், வழங்கப்பட்ட சூழலில் இருந்து பொருத்தமான தகவலைக் கண்டறிந்து பயன்படுத்துவதற்கு இது மாதிரியைப் பயிற்றுவிக்கிறது.
  2. இது பொருத்தமற்ற தகவலைப் புறக்கணிக்கும் மாடலின் திறனை மேம்படுத்துகிறது, பயனுள்ள RAGக்கான முக்கியமான திறன்.
  3. இது சூழலில் பதில் இல்லாத காட்சிகளுக்கு மாதிரியை வெளிப்படுத்துகிறது, தேவைப்படும்போது அதன் சொந்த அறிவை நம்புவதற்கு ஊக்குவிக்கிறது.

RAFT இன் மற்றொரு முக்கிய அம்சம், பயிற்சி செயல்முறையில் சிந்தனைப் பகுத்தறிவை இணைப்பதாகும். கேள்வி பதில் ஜோடிகளை வழங்குவதற்குப் பதிலாக, RAFT விரிவான பகுத்தறிவு விளக்கங்களை உருவாக்குகிறது, அதில் தொடர்புடைய ஆவணங்களிலிருந்து வினைச்சொல் மேற்கோள்கள் அடங்கும். இந்த விளக்கங்கள், ஒரு சிந்தனை வடிவத்தில் வழங்கப்படுகின்றன, சரியான பதிலைப் பெற தேவையான தர்க்கரீதியான படிகள் மூலம் மாதிரியை வழிநடத்துகின்றன.

இந்த பகுத்தறிவுச் சங்கிலிகளில் மாதிரியைப் பயிற்றுவிப்பதன் மூலம், வலுவான பகுத்தறியும் திறன்களின் வளர்ச்சியை RAFT ஊக்குவிக்கிறது மற்றும் வெளிப்புற அறிவு ஆதாரங்களை எவ்வாறு திறம்பட மேம்படுத்துவது என்பது குறித்த மாதிரியின் புரிதலை மேம்படுத்துகிறது.

மதிப்பீடு மற்றும் முடிவுகள்

RAFT தாளின் ஆசிரியர்கள், PubMed (பயோமெடிக்கல் ஆராய்ச்சி), HotpotQA (ஓபன்-டொமைன் கேள்வி பதில்) மற்றும் கொரில்லா APIBench (குறியீடு உருவாக்கம்) உள்ளிட்ட பல்வேறு தரவுத்தொகுப்புகளில் விரிவான மதிப்பீடுகளை மேற்கொண்டனர். RAG உடன் மற்றும் இல்லாமல் டொமைன்-குறிப்பிட்ட ஃபைன்-ட்யூனிங், அத்துடன் RAG உடன் GPT-3.5 போன்ற பெரிய மாடல்கள் போன்ற அடிப்படைகளை RAFT தொடர்ந்து சிறப்பாகச் செயல்பட்டது என்பதை அவற்றின் முடிவுகள் நிரூபித்தன.

RAFT RAG செயல்திறனை மேம்படுத்துகிறது

RAFT RAG செயல்திறனை மேம்படுத்துகிறது

எடுத்துக்காட்டாக, HuggingFace தரவுத்தொகுப்பில், RAFT ஆனது 74% துல்லியத்தை அடைந்தது, டொமைன்-குறிப்பிட்ட ஃபைன்-ட்யூனிங் (DSF) ஐ விட 31.41% மற்றும் RAG உடன் GPT-44.92 ஐ விட 3.5% குறிப்பிடத்தக்க முன்னேற்றம். இதேபோல், HotpotQA தரவுத்தொகுப்பில், RAFT ஆனது DSF உடன் ஒப்பிடும்போது 28.9% துல்லிய ஆதாயத்தை வெளிப்படுத்தியது.

RAFT இன் முக்கிய நன்மைகளில் ஒன்று குறைபாடுகளை மீட்டெடுப்பதற்கான அதன் வலிமையாகும். தொடர்புடைய மற்றும் பொருத்தமற்ற ஆவணங்களின் கலவையுடன் மாடலைப் பயிற்றுவிப்பதன் மூலம், மீட்டெடுப்பு தொகுதி துணை முடிவுகளைத் தரும்போது கூட, தொடர்புடைய தகவலைக் கண்டறிந்து முன்னுரிமை அளிக்கும் மாடலின் திறனை RAFT மேம்படுத்துகிறது.

கவனத்தை சிதறடிக்கும் ஆவணங்களை உள்ளடக்கிய உள்ளமைவுகளுடன் ஒப்பிடும்போது, ​​ஆரக்கிள் ஆவணங்களை மட்டும் நன்றாகச் சரிசெய்வது பெரும்பாலும் தாழ்வான செயல்திறனுக்கு வழிவகுக்கிறது என்பதை ஆசிரியர்கள் நிரூபித்துள்ளனர். இந்த கண்டுபிடிப்பு பயிற்சியின் போது மாறுபட்ட மீட்டெடுப்பு காட்சிகளுக்கு மாதிரியை வெளிப்படுத்துவதன் முக்கியத்துவத்தை அடிக்கோடிட்டுக் காட்டுகிறது, இது நிஜ உலக பயன்பாடுகளுக்கான அதன் தயார்நிலையை உறுதி செய்கிறது.

நடைமுறை பயன்பாடுகள் மற்றும் எதிர்கால திசைகள்

RAFT நுட்பமானது பரந்த அளவிலான நடைமுறை பயன்பாடுகளுக்கு குறிப்பிடத்தக்க தாக்கங்களைக் கொண்டுள்ளது, அவற்றுள்:

  1. கேள்வி பதில் அமைப்புகள்: RAFT மிகவும் துல்லியமான மற்றும் டொமைன் சார்ந்த கேள்விகளுக்கு பதிலளிக்கும் அமைப்புகளை உருவாக்க பயன்படுத்தப்படலாம், இது மாதிரியின் கற்றறிந்த அறிவு மற்றும் வெளிப்புற அறிவு ஆதாரங்கள் இரண்டையும் மேம்படுத்துகிறது.
  2. நிறுவன அறிவு மேலாண்மை: பெரிய அறிவுத் தளங்களைக் கொண்ட நிறுவனங்கள், தனிப்பயனாக்கப்பட்ட கேள்விகளுக்கு பதிலளிக்கும் அமைப்புகளை உருவாக்க RAFT ஐப் பயன்படுத்த முடியும், இது பணியாளர்களை விரைவாக அணுகவும் பொருத்தமான தகவலைப் பயன்படுத்தவும் உதவுகிறது.
  3. மருத்துவ மற்றும் அறிவியல் ஆராய்ச்சி: உயிரியல் மருத்துவ ஆராய்ச்சி போன்ற களங்களில் RAFT மிகவும் மதிப்புமிக்கதாக இருக்கும், அங்கு அறிவியல் புரிதலை மேம்படுத்துவதற்கு சமீபத்திய கண்டுபிடிப்புகள் மற்றும் இலக்கியங்களுக்கான அணுகல் முக்கியமானது.
  4. சட்ட மற்றும் நிதிச் சேவைகள்: தொடர்புடைய சட்ட ஆவணங்கள் அல்லது நிதி அறிக்கைகளின் அடிப்படையில் துல்லியமான மற்றும் சூழல்-விழிப்புணர்வு பதில்களை வழங்குவதன் மூலம் இந்தத் துறைகளில் நிபுணர்களுக்கு RAFT உதவ முடியும்.

இந்த பகுதியில் ஆராய்ச்சி தொடர்வதால், RAFT நுட்பத்தில் மேலும் முன்னேற்றங்கள் மற்றும் சுத்திகரிப்புகளை எதிர்பார்க்கலாம். சாத்தியமான எதிர்கால திசைகளில் பின்வருவன அடங்கும்:

  1. குறிப்பிட்ட களங்கள் அல்லது ஆவணக் கட்டமைப்புகளுக்கு ஏற்றவாறு மிகவும் திறமையான மற்றும் பயனுள்ள மீட்டெடுப்பு தொகுதிகள் பற்றிய ஆய்வு.
  2. மேம்பட்ட சூழல் புரிதலுக்கான படங்கள் அல்லது அட்டவணைகள் போன்ற பல மாதிரி தகவல்களை RAFT கட்டமைப்பில் ஒருங்கிணைத்தல்.
  3. பயிற்சியின் போது உருவாக்கப்பட்ட சிந்தனை விளக்கங்களை சிறப்பாகப் பயன்படுத்தக்கூடிய சிறப்புப் பகுத்தறிவு கட்டமைப்புகளின் வளர்ச்சி.
  4. சுருக்கம், மொழிபெயர்ப்பு அல்லது உரையாடல் அமைப்புகள் போன்ற கேள்விகளுக்குப் பதில்களைத் தவிர மற்ற இயல்பான மொழிப் பணிகளுக்கு RAFT இன் தழுவல்.

தீர்மானம்

RAFT ஆனது, மொழி மாதிரிகள் மூலம் டொமைன் சார்ந்த கேள்விகளுக்கு பதிலளிக்கும் துறையில் குறிப்பிடத்தக்க முன்னேற்றத்தை குறிக்கிறது. மீட்டெடுப்பு-அதிகப்படுத்தப்பட்ட தலைமுறை மற்றும் சிறந்த-சரிப்படுத்தும் வலிமையை இணக்கமாக கலப்பதன் மூலம், RAFT ஆனது LLMகளை வெளிப்புற அறிவு ஆதாரங்களை திறம்பட மேம்படுத்தும் திறனையும், அதே நேரத்தில் டொமைன்-குறிப்பிட்ட வடிவங்கள் மற்றும் விருப்பத்தேர்வுகளுடன் அவற்றின் வெளியீடுகளை சீரமைக்கும் திறனையும் வழங்குகிறது.

அதன் புதுமையான பயிற்சி தரவு க்யூரேஷன், சிந்தனைப் பகுத்தறிவை இணைத்தல் மற்றும் குறைபாடுகளை மீட்டெடுப்பதற்கான வலிமை ஆகியவற்றின் மூலம், சிறப்பு களங்களில் LLM களின் முழு திறனையும் திறக்க விரும்பும் நிறுவனங்கள் மற்றும் ஆராய்ச்சியாளர்களுக்கு RAFT ஒரு சக்திவாய்ந்த தீர்வை வழங்குகிறது.

டொமைன்-குறிப்பிட்ட இயற்கை மொழி செயலாக்க திறன்களுக்கான தேவை தொடர்ந்து வளர்ந்து வருவதால், RAFT போன்ற நுட்பங்கள் மிகவும் துல்லியமான, சூழல்-விழிப்புணர்வு மற்றும் தகவமைப்பு மொழி மாதிரிகளை செயல்படுத்துவதில் முக்கிய பங்கு வகிக்கும், மனித-இயந்திர தொடர்பு உண்மையானதாக மாறும் எதிர்காலத்திற்கு வழி வகுக்கும். தடையற்ற மற்றும் டொமைன்-அஞ்ஞானவாதி.

இயந்திர கற்றல் மற்றும் ஆழமான கற்றல் ஆகியவற்றின் கவர்ச்சிகரமான உலகில் மூழ்கி கடந்த ஐந்து வருடங்களாக நான் செலவிட்டேன். எனது ஆர்வமும் நிபுணத்துவமும் AI/ML இல் குறிப்பிட்ட கவனம் செலுத்தி, 50க்கும் மேற்பட்ட பல்வேறு மென்பொருள் பொறியியல் திட்டங்களில் பங்களிக்க என்னை வழிவகுத்தது. எனது தற்போதைய ஆர்வமும் என்னை இயற்கை மொழி செயலாக்கத்தை நோக்கி ஈர்த்துள்ளது, மேலும் நான் ஆராய ஆர்வமாக உள்ள ஒரு துறை.