Yapay Zeka

Geri Getirilebilir Artırılmış Dil Modellerinin Geliştirilmesi: Konuşma Sistemleri için Kendi Kendine Muhakeme ve Uyarlanabilir Büyütme

Yayınlanan Ağustos 15, 2024

Güncellenmiş 15 Kasım 2024

Aayush Mittal Mittal

kendi kendine muhakeme çerçeveleri ve uyarlanabilir erişimle artırılmış nesil

Büyük dil modelleri, özellikle karmaşık bilgi tabanlı görevlerde sıklıkla kesin ve güncel bilgiler sunmakta zorlanır. Bu engellerin üstesinden gelmek için araştırmacılar, bu modelleri dış veri kaynaklarıyla entegre ederek geliştirme yöntemlerini araştırıyorlar.

Bu alanda ortaya çıkan iki yeni yaklaşım şunlardır: kendi kendine muhakeme çerçeveleri ve konuşma sistemleri için uyarlanabilir erişimle artırılmış nesilBu yazıda, bu yenilikçi tekniklerin derinliklerine inecek ve dil modelleriyle mümkün olanın sınırlarını nasıl zorladıklarını inceleyeceğiz.

Erişimle Artırılmış Dil Modellerinin Vaatleri ve Tuzakları

Geri Alma-Artırılmış Dil Modelleri (RALM'ler) kavramını anlayalım. RALM'lerin ardındaki temel fikir, önceden eğitilmiş dil modellerinin engin bilgi birikimini ve dil anlama yeteneklerini, çıkarım sırasında harici ve güncel bilgilere erişme ve bunları dahil etme becerisiyle birleştirmektir.

İşte temel bir RALM'ın nasıl çalışabileceğine dair basit bir örnek:

Bir kullanıcı şu soruyu soruyor: “2024 Olimpiyat Oyunlarının sonucu ne oldu?”
Sistem ilgili belgeleri harici bir bilgi tabanından alır.
Yüksek Lisans, soruyu alınan bilgilerle birlikte işler.
Model, hem iç bilgisine hem de dış verilere dayalı bir yanıt üretir.

Bu yaklaşım, özellikle mevcut bilgilere veya alana özgü bilgilere erişim gerektiren görevler için LLM çıktılarının doğruluğunu ve uygunluğunu artırma konusunda büyük umut vaat ediyor. Ancak RALM'lerin de zorlukları yok değil. Araştırmacıların uğraştığı iki önemli konu şunlardır:

Güvenilirlik: Alınan bilgilerin alakalı ve yararlı olmasını nasıl sağlayabiliriz?
İzlenebilirlik:Modelin akıl yürütme sürecini nasıl daha şeffaf ve doğrulanabilir hale getirebiliriz?

Son araştırmalar bu zorluklara yenilikçi çözümler öneriyor; bunları derinlemesine inceleyeceğiz.

Kendi Kendine Muhakeme: RALM'leri Açık Muhakeme Yörüngeleriyle Geliştirme

Bu, Öz-Muhakeme adı verilen bir çerçeveye odaklanan, geri alma destekli LLM'lerin arkasındaki mimari ve süreçtir. Bu yaklaşım, modelin geri alınan belgeler üzerinde akıl yürütme yeteneğini geliştirmek için yörüngeler kullanır.

Bir soru sorulduğunda ilgili belgeler bir dizi akıl yürütme adımıyla alınır ve işlenir. Kendi Kendine Muhakeme mekanizması, nihai cevabı oluşturmadan önce bilgileri filtrelemek ve sentezlemek için kanıta dayalı analiz ve yörünge analizi süreçlerini uygular. Bu yöntem yalnızca çıktının doğruluğunu arttırmakla kalmaz, aynı zamanda cevapların ardındaki mantığın şeffaf ve izlenebilir olmasını da sağlar.

Yukarıda verilen örneklerde, örneğin "Catch Me If You Can" filminin vizyon tarihini belirlemek veya Floransa Katedrali'nin tavanını boyayan sanatçıları tespit etmek gibi durumlarda, model alınan belgeleri etkili bir şekilde filtreleyerek doğru ve bağlamsal olarak desteklenen yanıtlar üretiyor.

Bu tablo, LLaMA2 modelleri ve NaturalQuestions, PopQA, FEVER ve ASQA gibi görevler genelinde diğer erişimle artırılmış modeller de dahil olmak üzere farklı LLM varyantlarının karşılaştırmalı bir analizini sunar. Sonuçlar, geri alınmayan taban çizgileri ve geri alma yetenekleriyle geliştirilmiş olanlar arasında bölünür.

Bu görsel, bir LLM'nin kullanıcı sorgularına dayalı öneriler sunmakla görevlendirildiği bir senaryoyu sunmakta ve harici bilgi kullanımının yanıtların kalitesini ve alakalılığını nasıl etkileyebileceğini göstermektedir. Diyagram iki yaklaşımı vurgulamaktadır: biri modelin bir bilgi kırıntısını kullandığı, diğeri ise kullanmadığı yaklaşım. Karşılaştırma, belirli bilgilerin dahil edilmesinin yanıtları kullanıcının ihtiyaçlarıyla daha uyumlu hale getirebileceğini ve salt üretken bir modelde eksik olabilecek derinlik ve doğruluğu nasıl sağlayabileceğini vurgulamaktadır.

RALM'leri iyileştirmeye yönelik çığır açıcı yaklaşımlardan biri, öz-muhakeme çerçevelerinin tanıtılmasıdır. Bu yöntemin temel fikri, dil modelinin kendi yeteneklerinden yararlanarak açık muhakeme yörüngeleri üretmek ve bu yörüngelerin daha sonra çıktılarının kalitesini ve güvenilirliğini artırmak için kullanılabilmesini sağlamaktır.

Öz-akıl yürütme çerçevesinin temel bileşenlerini inceleyelim:

Uygunluk Farkındalık Süreci (RAP)
Kanıta Duyarlı Seçici Süreç (EAP)
Yörünge Analizi Süreci (MUSLUK)

İlgililik Farkındalık Süreci (RAP)

RAP, RALM'lerin temel zorluklarından biri olan, alınan belgelerin verilen soruyla gerçekten alakalı olup olmadığını belirlemeyi ele almak üzere tasarlanmıştır. İşleyiş şekli şöyledir:

Sistem, bir alma modeli (örneğin, DPR veya Contriever) kullanarak bir dizi potansiyel olarak ilgili belgeyi alır.
Dil modeline daha sonra bu belgelerin soruyla ilgisini yargılaması talimatı verilir.
Model, belgelerin neden ilgili veya ilgisiz olarak kabul edildiğini açıklayan nedenleri açıkça üretir.

Örneğin, “Eyfel Kulesi ne zaman inşa edildi?” sorusu verildiğinde RAP şu şekilde çıktı üretebilir:

Relevant: True

Relevant Reason: The retrieved documents contain specific information about the construction dates of the Eiffel Tower, including its commencement in 1887 and completion in 1889.

Bu süreç, boru hattının başlarında alakasız bilgilerin filtrelenmesine yardımcı olarak modelin yanıtlarının genel kalitesini artırır.

Kanıta Duyarlı Seçici Süreç (EAP)

EAP, modele ilgili belgelerden belirli kanıt parçalarını belirlemesini ve alıntılamasını söyleyerek alaka değerlendirmesini bir adım öteye taşır. Bu süreç, insanların bir araştırma görevine nasıl yaklaşabileceğini taklit eder; anahtar cümleleri seçer ve bunların alakalarını açıklar. EAP çıktısı şöyle görünebilir:

Cite content: "Construction of the Eiffel Tower began on January 28, 1887, and was completed on March 31, 1889."

Reason to cite: This sentence provides the exact start and end dates for the construction of the Eiffel Tower, directly answering the question about when it was built.

EAP, kaynakları açıkça belirterek ve her bir kanıtın önemini açıklayarak, modelin çıktılarının izlenebilirliğini ve yorumlanabilirliğini artırır.

Yörünge Analiz Süreci (TAP)

TAP, modelin önceki adımlarda oluşturulan tüm akıl yürütme yörüngelerini birleştirdiği kendi kendine muhakeme çerçevesinin son aşamasıdır. Bu gidişatları analiz eder ve nihai yanıtla birlikte kısa bir özet üretir. TAP'ın çıktısı şuna benzer:

Analysis: The Eiffel Tower was built between 1887 and 1889. Construction began on January 28, 1887, and was completed on March 31, 1889. This information is supported by multiple reliable sources that provide consistent dates for the tower's construction period.

Cevap: Eyfel Kulesi 1887'den 1889'a kadar inşa edilmiştir.

Bu süreç, modelin hem gerekçesine ilişkin ayrıntılı bir açıklama hem de farklı kullanıcı ihtiyaçlarını karşılayan kısa bir yanıt sunmasına olanak tanır.

Kendi Kendine Muhakeme Yapmanın Pratikte Uygulanması

Bu kendi kendine muhakeme çerçevesini uygulamak için araştırmacılar aşağıdakiler de dahil olmak üzere çeşitli yaklaşımları araştırdılar:

Önceden eğitilmiş dil modellerini yönlendirme
QLoRA gibi parametre açısından verimli tekniklerle dil modellerine ince ayar yapma
Çok kafalı dikkat modelleri gibi uzmanlaşmış sinir mimarilerinin geliştirilmesi

Bu yaklaşımların her birinin performans, verimlilik ve uygulama kolaylığı açısından kendi ödünleri vardır. Örneğin, yönlendirme yaklaşımının uygulanması en basit yöntemdir ancak her zaman tutarlı sonuçlar vermeyebilir. QLoRA ile ince ayar yapmak iyi bir performans ve verimlilik dengesi sunarken, özel mimariler en iyi performansı sağlayabilir ancak eğitim için daha fazla hesaplama kaynağı gerektirir.

İşte GPT-3 gibi bir dil modeliyle bir yönlendirme yaklaşımı kullanarak RAP'ı nasıl uygulayabileceğinize dair basitleştirilmiş bir örnek:

import openai

def relevance_aware_process(question, documents):
    prompt = f"""
    Question: {question}
    
    Retrieved documents:
    {documents}
    
    Task: Determine if the retrieved documents are relevant to answering the question.
    Output format:
    Relevant: [True/False]
    Relevant Reason: [Explanation]
    
    Your analysis:
    """
    
    response = openai.Completion.create(
        engine="text-davinci-002",
        prompt=prompt,
        max_tokens=150
    )
    
    return response.choices[0].text.strip()

# Example usage
question = "When was the Eiffel Tower built?"
documents = "The Eiffel Tower is a wrought-iron lattice tower on the Champ de Mars in Paris, France. It is named after the engineer Gustave Eiffel, whose company designed and built the tower. Constructed from 1887 to 1889 as the entrance arch to the 1889 World's Fair, it was initially criticized by some of France's leading artists and intellectuals for its design, but it has become a global cultural icon of France."

result = relevance_aware_process(question, documents)
print(result)

Bu örnek, RAP'nin basit bir yönlendirme yaklaşımı kullanılarak nasıl uygulanabileceğini göstermektedir. Uygulamada tutarlılığı sağlamak ve uç durumları ele almak için daha karmaşık teknikler kullanılacaktır.

Konuşma Sistemleri için Uyarlanabilir Erişim-Artırılmış Nesil

Kendi kendine muhakeme çerçevesi, bireysel yanıtların kalitesini ve yorumlanabilirliğini geliştirmeye odaklanırken, başka bir araştırma alanı, geri getirmeyle artırılmış neslin konuşma sistemleri bağlamında nasıl daha uyumlu hale getirilebileceğini araştırıyor. Uyarlanabilir erişim-artırılmış nesil olarak bilinen bu yaklaşım, dış bilginin bir konuşmada ne zaman kullanılması gerektiğini ve bunun etkili bir şekilde nasıl dahil edileceğini belirlemeyi amaçlamaktadır.

Bu yaklaşımın ardındaki temel fikir, bir konuşmadaki her adımın harici bilgi zenginleştirmesi gerektirmediğidir. Bazı durumlarda, elde edilen bilgilere aşırı güvenmek, doğal olmayan veya aşırı ayrıntılı yanıtlara yol açabilir. Dolayısıyla asıl zorluk, harici bilgiyi ne zaman kullanacağına ve modelin içsel yeteneklerine ne zaman güveneceğine dinamik olarak karar verebilen bir sistem geliştirmektir.

Uyarlanabilir Geri Alma-Artırılmış Üretimin Bileşenleri

Bu zorluğun üstesinden gelmek için araştırmacılar, RAGate adında birkaç temel bileşenden oluşan bir çerçeve önerdiler:

İkili bilgi kapısı mekanizması
Uygunluğun farkında olan bir süreç
Kanıta dayalı seçici bir süreç
Bir yörünge analizi süreci

İkili Bilgi Kapısı Mekanizması

RAGate sisteminin özü, belirli bir konuşma sırası için harici bilginin kullanılıp kullanılmayacağına karar veren ikili bir bilgi kapısıdır. Bu kapı, kararını vermek için konuşma bağlamını ve isteğe bağlı olarak alınan bilgi parçacıklarını dikkate alır.

İkili bilgi kapısının nasıl çalışabileceğine dair basitleştirilmiş bir örnek şöyledir:

def knowledge_gate(context, retrieved_knowledge=None):
    # Analyze the context and retrieved knowledge
    # Return True if external knowledge should be used, False otherwise
    pass

def generate_response(context, knowledge=None):
    if knowledge_gate(context, knowledge):
        # Use retrieval-augmented generation
        return generate_with_knowledge(context, knowledge)
    else:
        # Use standard language model generation
        return generate_without_knowledge(context)

Bu geçiş mekanizması, sistemin dış bilgi kullanımında daha esnek ve bağlama duyarlı olmasını sağlar.

RAGate'in uygulanması

Bu görüntü, gelişmiş yanıt üretimi için dış bilgileri Yüksek Lisans'lara dahil etmek üzere tasarlanmış gelişmiş bir sistem olan RAGate çerçevesini göstermektedir. Bu mimari, temel bir LLM'nin, doğrudan girdi yoluyla veya üretim süreci sırasında harici veritabanlarının entegre edilmesi yoluyla bağlam veya bilgi ile nasıl desteklenebileceğini gösterir. Hem dahili model yeteneklerini hem de harici verileri kullanan bu ikili yaklaşım, LLM'nin daha doğru ve bağlamsal olarak anlamlı yanıtlar vermesini sağlar. Bu hibrit yöntem, ham hesaplama gücü ile alana özgü uzmanlık arasındaki boşluğu dolduruyor.

Bu, RAGate çerçevesi kapsamındaki çeşitli model çeşitleri için performans ölçümlerini sergiliyor; bu, geri almanın parametre açısından verimli ince ayar (PEFT) ile entegre edilmesine odaklanıyor. Sonuçlar, bağlamla entegre modellerin, özellikle de daha yakın bilgi ve daha yakın kaynak yerleştirmelerini kullanan modellerin üstünlüğünü vurgulamaktadır.

RAGate-PEFT ve RAGate-MHA modelleri, hem bağlam hem de bilgi girdilerini birleştirmenin faydalarını vurgulayarak hassasiyet, hatırlama ve F1 puanlarında önemli iyileşmeler sergiliyor. Bu ince ayar stratejileri, modellerin bilgi yoğun görevlerde daha etkili performans göstermesini sağlayarak gerçek dünya uygulamaları için daha sağlam ve ölçeklenebilir bir çözüm sunar.

RAGate'i uygulamak için araştırmacılar aşağıdakiler de dahil olmak üzere çeşitli yaklaşımları araştırdılar:

Dikkatlice hazırlanmış bilgi istemleriyle büyük dil modellerini kullanma
Parametre açısından verimli teknikler kullanarak dil modellerine ince ayar yapma
Çok kafalı dikkat modelleri gibi uzmanlaşmış sinir mimarilerinin geliştirilmesi

Bu yaklaşımların her birinin kendine özgü güçlü ve zayıf yönleri vardır. Örneğin, yönlendirme yaklaşımının uygulanması nispeten basittir ancak her zaman tutarlı sonuçlar vermeyebilir. İnce ayar, performans ve verimlilik arasında iyi bir denge sunarken, özel mimariler en iyi performansı sağlayabilir ancak eğitim için daha fazla hesaplama kaynağı gerektirir.

İşte ince ayarlı bir dil modeli kullanarak RAGate benzeri bir sistemi nasıl uygulayabileceğinize dair basitleştirilmiş bir örnek:

 
import torch
from transformers import AutoTokenizer, AutoModelForSequenceClassification

class RAGate:
    def __init__(self, model_name):
        self.tokenizer = AutoTokenizer.from_pretrained(model_name)
        self.model = AutoModelForSequenceClassification.from_pretrained(model_name)
        
    def should_use_knowledge(self, context, knowledge=None):
        inputs = self.tokenizer(context, knowledge or "", return_tensors="pt", truncation=True, max_length=512)
        with torch.no_grad():
            outputs = self.model(**inputs)
        probabilities = torch.softmax(outputs.logits, dim=1)
        return probabilities[0][1].item() &amp;gt; 0.5  # Assuming binary classification (0: no knowledge, 1: use knowledge)

class ConversationSystem:
    def __init__(self, ragate, lm, retriever):
        self.ragate = ragate
        self.lm = lm
        self.retriever = retriever
        
    def generate_response(self, context):
        knowledge = self.retriever.retrieve(context)
        if self.ragate.should_use_knowledge(context, knowledge):
            return self.lm.generate_with_knowledge(context, knowledge)
        else:
            return self.lm.generate_without_knowledge(context)

# Example usage
ragate = RAGate("path/to/fine-tuned/model")
lm = LanguageModel()  # Your preferred language model
retriever = KnowledgeRetriever()  # Your knowledge retrieval system

conversation_system = ConversationSystem(ragate, lm, retriever)

context = "User: What's the capital of France?\nSystem: The capital of France is Paris.\nUser: Tell me more about its famous landmarks."
response = conversation_system.generate_response(context)
print(response)

Bu örnek, RAGate benzeri bir sistemin pratikte nasıl uygulanabileceğini göstermektedir. RAGate Sınıf, dış bilginin kullanılıp kullanılmayacağına karar vermek için ince ayarlı bir model kullanır. ConversationSystem sınıf, kapı, dil modeli ve alıcı arasındaki etkileşimi düzenler.

Zorluklar ve Gelecekteki Yönler

Kendi kendini muhakeme eden çerçeveler ve uyarlanabilir erişimle artırılmış nesil büyük umut vaat ediyor olsa da, araştırmacıların hâlâ çözmeye çalıştığı çeşitli zorluklar var:

Hesaplamalı Verimlilik: Her iki yaklaşım da, özellikle büyük miktarlarda alınan bilgiyle uğraşırken veya uzun akıl yürütme yörüngeleri oluştururken, hesaplama açısından yoğun olabilir. Bu süreçlerin gerçek zamanlı uygulamalar için optimize edilmesi aktif bir araştırma alanı olmaya devam etmektedir.
sağlamlık: Bu sistemlerin çok çeşitli konu ve soru türlerinde tutarlı performans göstermesini sağlamak çok önemlidir. Bu, ilgi değerlendirmesini veya geçiş mekanizmalarını karıştırabilecek uç durumların ve karşıt girdilerin ele alınmasını içerir.
Çok Dilli ve Çapraz Dil Desteği: Bu yaklaşımların birden fazla dilde etkili bir şekilde çalışacak ve diller arası bilgi erişimini ve akıl yürütmeyi ele alacak şekilde genişletilmesi, gelecekteki çalışmalar için önemli bir yöndür.
Diğer Yapay Zeka Teknolojileriyle Entegrasyon: Bu yaklaşımların çok modlu modeller veya takviyeli öğrenme gibi diğer yapay zeka teknolojileriyle nasıl birleştirilebileceğini keşfetmek, daha güçlü ve esnek sistemlere yol açabilir.

Sonuç

Kendi kendini muhakeme eden çerçevelerin ve uyarlanabilir erişimle artırılmış nesillerin geliştirilmesi, doğal dil işleme alanında ileriye doğru atılan önemli bir adımı temsil etmektedir. Dil modellerinin kullandıkları bilgiler hakkında açık bir şekilde akıl yürütmesini ve bilgi artırma stratejilerini dinamik olarak uyarlamasını sağlayan bu yaklaşımlar, yapay zeka sistemlerini daha güvenilir, yorumlanabilir ve bağlama duyarlı hale getirmeyi vaat ediyor.

Bu alandaki araştırmalar gelişmeye devam ettikçe, bu tekniklerin rafine edildiğini ve soru cevap sistemlerinden sanal asistanlara, eğitim araçlarına ve araştırma yardımcılarına kadar çok çeşitli uygulamalara entegre edildiğini görmeyi bekleyebiliriz. Büyük dil modellerinde kodlanan geniş bilgiyi dinamik olarak alınan güncel bilgilerle birleştirme yeteneği, yapay zeka sistemleriyle etkileşimde bulunma ve bilgiye erişme şeklimizde devrim yaratma potansiyeline sahiptir.

Bir sonraki

Gizlilik Arka Kapılarının Maskesini Ortaya Çıkarma: Önceden Eğitimli Modeller Verilerinizi Nasıl Çalabilir ve Bu Konuda Ne Yapabilirsiniz?

Kaçırmayın

Doğrudan Tercih Optimizasyonu: Eksiksiz Bir Kılavuz

Aayush Mittal

Son beş yılımı, Makine Öğrenimi ve Derin Öğrenmenin büyüleyici dünyasına dalarak geçirdim. Tutkum ve uzmanlığım, özellikle AI/ML'ye odaklanarak 50'den fazla farklı yazılım mühendisliği projesine katkıda bulunmamı sağladı. Devam eden merakım, beni daha fazla keşfetmeye hevesli olduğum bir alan olan Doğal Dil İşleme'ye de çekti.

Unite.AI