Yapay Zekâ

RAFT – Alan Spesifik Soru Yanıtına Yönelik İnce Ayarlama ve RAG Yaklaşımı

Published March 29, 2024

Updated April 27, 2026

Aayush Mittal Mittal

Büyük dil modellerinin uzmanlık alanlarına genişlemesi ile birlikte, etkili ve verimli uyarlanma tekniklerine olan ihtiyaç giderek daha kritik hale geliyor. RAFT (Retriever ile Geliştirilmiş İnce Ayarlama) adlı yeni bir yaklaşım, retrieval-augmented generation (RAG) ve ince ayarlama güçlü yönlerini birleştirerek, özellikle alan spesifik soru cevaplama görevleri için tasarlandı.

Alan Uyarlaması Zorluğu

Büyük dil modelleri (LLM’ler) geniş veri setleri üzerinde önceden eğitilmiş olsalar da, tıbbi araştırma, yasal belgeler veya şirket spesifik bilgi tabanları gibi uzmanlık alanlarında iyi performans gösterme yetenekleri sıklıkla sınırlıdır. Bu sınırlama, önceden eğitim verilerinin bu uzmanlık alanlarının nüanslarını ve karmaşıklıklarını yeterince temsil etmemesinden kaynaklanmaktadır. Bu zorluğu gidermek için araştırmacılar geleneksel olarak iki ana teknik kullanmışlardır: retrieval-augmented generation (RAG) ve ince ayarlama.

Retriever ile Geliştirilmiş Oluşturma (RAG)

RAG

RAG bir tekniği olup, büyük dil modellerinin (LLM’ler) dış kaynaklardan bilgi almasına ve kullanmasına olanak tanır.

Bu, gerçek zamanlı veri alma işlemini üretken sürece entegre ederek, modelin çıktılarını daha doğru ve güncel hale getirir. RAG üç temel adımdan oluşur: alma, ilgili belgelerin toplandığı adım; üretim, modelin alındığı verilere dayanarak bir çıktı ürettiği adım; ve artırma, çıktıyı daha da iyileştirme adımı.

RAG’deki alma süreci, bir kullanıcı sorgusuyla başlar. LLM’ler sorguyu analiz eder ve ilgili bilgileri dış veritabanlarından alır, modelin yanıtlarını oluşturmak için kullanabileceği bir veri havuzu sunar. Üretim aşaması bu girdileri birleştirerek tutarlı bir anlatı veya cevap oluşturur. Artırma adımı, üretimi daha da iyileştirerek bağlam veya tutarlılık ve alaka için ayarlamalar yapar.

RAG modelleri, doğru, ilgili ve güncel bilgi sağlama yeteneklerini değerlendiren çeşitli ölçütlere göre değerlendirilebilir.

İnce Ayarlama

supervised-fine-tuning

İnce ayarlama, bir önceden eğitilmiş LLM’yi, daha küçük, görev spesifik bir veri seti üzerinde进一步 eğitmeyi içerir. Bu yaklaşım, modelin öğrenme kalıplarını ve çıktılarını istenilen görev veya alana hizalamasını sağlar. İnce ayarlama, modelin performansını iyileştirebilse de, dış bilgi kaynaklarını etkili bir şekilde entegre etme veya çıkarma hatalarını hesaba katmada genellikle başarısız olur.

RAFT Yaklaşımı

RAFT

RAFT yani Retriever ile Bilinçli İnce Ayarlama, dil modellerinin performansını, özellikle açık kitap sınavları için, geliştirmek üzere tasarlanmış yenilikçi bir eğitim yöntemidir. RAFT, standart ince ayarlamadan, eğitim verilerini, ilgili ve alakasız belgelerle birlikte, zincir düşünce tarzı cevaplar içeren sorularla hazırlayarak ayrılır. Bu yöntem, modellerin sadece bilgiyi hatırlamakla kalmayıp, aynı zamanda sağlanan içerikten cevaplar çıkarmasını ve akıl yürütmeyi geliştirmeyi amaçlar.

Aslında, RAFT, dil modellerini, belge okuma ve bilgi çıkarma görevlerinde daha yetkin hale getirmeyi amaçlar. Hem “oracle” belgeleri (cevabı içeren) hem de “distractor” belgeleri (cevabı içermeyen) kullanarak, model, ilgili bilgileri daha etkili bir şekilde ayırt etmeyi ve kullanmayı öğrenir.

Eğitim Verisi Hazırlama

RAFT altında eğitim süreci, verilerin bir kısmının doğrudan cevaba ilişkin “oracle” belgelerini içerdiği, geri kalanının ise sadece “distractor” belgelerden oluştuğu bir yapıya sahiptir. İnce ayarlama, modelin, internal bilgisine (benzeri bir şekilde hafıza) ne zaman güveneceğini ve bağlamdan bilgi çıkarmayı ne zaman kullanacağını öğrenmesini teşvik eder.

RAFT’in eğitim rejimi ayrıca, akıl yürütme süreçlerinin oluşturulmasına da vurgu yapar. Bu, sadece cevabı oluşturmaya yardımcı olmakla kalmaz, aynı zamanda kaynakları alıntılar ve benzer şekilde bir insan, okudukları materyale atıfla cevabını haklı çıkarmaya çalışır. Bu yaklaşım, modelin bir RAG (Retriever ile Geliştirilmiş Oluşturma) ortamında, en iyi alınan belgileri dikkate alması gerektiğini öğretilmesinin yanı sıra, modelin eğitimini, kullanılan alıcıdan bağımsız hale getirir, böylece farklı alma sistemleri üzerinde esnek bir şekilde uygulanmasını sağlar.

Bu yaklaşım birden fazla amaca hizmet eder:

Modeli, sağlanan bağlamdan ilgili bilgileri tanımlamak ve kullanmak için eğitir, açık kitap sınavı ortamını taklit eder.
Modelin, alakasız bilgileri göz ardı etme yeteneğini geliştirir, etkili RAG için kritik bir beceridir.
Modeli, cevabın bağlamda bulunmadığı senaryolara maruz bırakır, bu durumda modelin kendi bilgisine güvenmesini teşvik eder.

RAFT’in bir başka önemli yönü, eğitim sürecine zincir düşünce akıl yürütmesinin entegrasyonudur. Sadece soru ve cevap çiftlerini sağlamak yerine, RAFT, ilgili belgelerden alıntılar içeren ayrıntılı akıl yürütme açıklamaları oluşturur. Bu açıklamalar, bir zincir düşünce formatında sunularak, modeli doğru cevaba ulaşmak için gereken mantıksal adımlar aracılığıyla yönlendirir.

Modeli bu akıl yürütme zincirleri üzerinde eğitmek, güçlü akıl yürütme yeteneklerinin gelişimini teşvik eder ve modelin dış bilgi kaynaklarını etkili bir şekilde nasıl kullanabileceğini anlamasını güçlendirir.

Değerlendirme ve Sonuçlar

RAFT makalesinin yazarları, çeşitli veri setleri üzerinde,包括 PubMed (tıbbi araştırma), HotpotQA (açık alan soru cevaplama) ve Gorilla APIBench (kod oluşturma) üzerinde kapsamlı değerlendirmeler gerçekleştirdiler. Sonuçları, RAFT’in, alan spesifik ince ayarlama ile ve بدون RAG, ve ayrıca RAG ile GPT-3.5 gibi daha büyük modellerden daha iyi performans gösterdiğini gösterdi.

RAFT improves RAG performance

Örneğin, HuggingFace veri setinde, RAFT %74’lük bir doğruluk oranı elde etti, bu, alan spesifik ince ayarlama (DSF) üzerinden %31.41’lik ve GPT-3.5 ile RAG üzerinden %44.92’lik önemli bir iyileşmedir. Benzer şekilde, HotpotQA veri setinde, RAFT %28.9’luk bir doğruluk artışı gösterdi.

RAFT’in önemli avantajlarından biri, alma hatalarına karşı dayanıklılığıdır. Modeli, ilgili ve alakasız belgelerin bir karışımı ile eğitmek, RAFT, modelin ilgili bilgileri ayırt etme ve önceliklendirme yeteneğini geliştirir, böylece alma modülü alt düzey sonuçlar döndürse bile.

Yazarlar, yalnızca “oracle” belgeleri ile ince ayarlamanın, “distractor” belgeleri içeren yapılandırmalardan daha düşük performans gösterdiğini gösterdi. Bu bulgu, modelin eğitiminde çeşitli alma senaryolarına maruz kalmasının önemini vurgular, böylece gerçek dünya uygulamalarına hazırlıklı olur.

Pratik Uygulamalar ve Gelecek Yönleri

RAFT tekniği, geniş bir uygulama yelpazesi için önemli sonuçlar doğurur, bunlar arasında:

Soru Cevap Sistemleri: RAFT, hem modelin öğrendiği bilginin hem de dış bilgi kaynaklarının kullanıldığı, yüksek doğrulukta ve alan spesifik soru cevaplama sistemleri oluşturmak için kullanılabilir.
Kurumsal Bilgi Yönetimi: Büyük bilgi tabanlarına sahip organizasyonlar, RAFT’i, çalışanların ilgili bilgileri hızlı bir şekilde erişip kullanabilmesi için özelleştirilmiş soru cevaplama sistemleri geliştirmek için kullanabilir.
Tıbbi ve Bilimsel Araştırma: RAFT, özellikle son bulgulara ve literatüre erişimin bilimsel anlayışın ilerlemesi için kritik olduğu tıbbi araştırma gibi alanlarda özellikle değerli olabilir.
Hukuk ve Finansal Hizmetler: RAFT, bu alanlardaki profesyonellere, ilgili yasal belgeler veya finansal raporlar temelinde doğru ve bağlamsal olarak farkındalıkla cevaplar sağlayabilir.

Bu alanda yapılan araştırmalar devam ettikçe, RAFT tekniğinde daha da ilerlemeler ve iyileştirmeler bekleyebiliriz. Gelecek yönlerden bazıları:

Belirli alanlar veya belge yapıları için daha verimli ve etkili alma modüllerinin keşfedilmesi.
Görüntüler veya tablolar gibi çoklu modlu bilgilerin RAFT çerçevesine entegrasyonu, bağlam anlaşılırlığını artırmak için.
Eğitim sırasında oluşturulan zincir düşünce açıklamalarını daha iyi kullanabilen özel akıl yürütme mimarilerinin geliştirilmesi.
RAFT’in, soru cevaplama ötesinde, özetleme, çeviri veya diyalog sistemleri gibi doğal dil işleme görevlerine uyarlanması.

Sonuç

RAFT, alan spesifik soru cevaplamada büyük dil modelleri için önemli bir ilerlemeyi temsil eder. Hem RAG hem de ince ayarmanın güçlü yönlerini birleştiren RAFT, LLM’leri dış bilgi kaynaklarını etkili bir şekilde kullanma ve çıktılarını alan spesifik kalıplar ve tercihlerle hizalama yeteneğiyle donatır.

Yenilikçi eğitim veri hazırlama, zincir düşünce akıl yürütmesinin entegrasyonu ve alma hatalarına karşı dayanıklılık ile RAFT, uzmanlık alanlarında LLM’lerin tam potansiyelini açığa çıkarmak isteyen organizasyonlar ve araştırmacılara güçlü bir çözüm sunar.

Alan spesifik doğal dil işleme yetenekleri talebi devam ettikçe, RAFT gibi teknikler, daha doğru, bağlamsal ve uyarlanabilir dil modellerinin geliştirilmesinde kilit rol oynayacak, böylece insan-makine iletişimi gerçekten sorunsuz ve alan bağımsız hale gelecek.

Aayush Mittal

Son beş yıldır Makine Öğrenimi ve Derin Öğrenme dünyasına kendimi daldırmış bulunuyorum. Tutkum ve uzmanlığım, özellikle AI/ML odaklı 50'den fazla çeşitli yazılım mühendisliği projesine katkıda bulunmama yol açtı. Süregelen meraklılığım ayrıca beni Doğal Dil İşleme'ye doğru çekti, bu alanda daha fazla keşfetmeye hevesliyim.