Yapay Zekâ

Büyük Dil Modellerinden Telifli Verilerin Unutulması – Mümkün mü?

mm
Blog Image of Copyright Symbols

Yapay zeka (AI) ve makine öğrenimi (ML) alanlarında, büyük dil modelleri (LLM’ler) hem başarıları hem de zorlukları sergiler. Devasa metin veri setlerine dayalı olarak eğitilen LLM modelleri, insan dilini ve bilgisini kapsar.

Ancak, insan anlayışını emme ve taklit etme yetenekleri, yasal, etik ve teknolojik zorluklar ortaya koyar. Ayrıca, LLM’leri güçlendirerek büyük veri setleri, toksik materyal, telifli metinler, yanlışlıklar veya kişisel veriler içerebilir.

Seçilen verileri unutmak, LLM’lerin yasal uyum ve etik sorumluluklarını sağlamak için acil bir sorun haline gelmiştir.

LLM’lerin telifli verileri unutmalarını sağlamak için bu kavramı keşfedelim ve temel bir soru soralım: Mümkün mü?

LLM Unutma Neden Gerekir?

LLM’ler thường tartışmalı veriler, telifli veriler dahil olmak üzere içerir. LLM’lerde böyle veriler bulunması, özel bilgiler, önyargılı bilgiler, telifli veriler ve yanlış veya zararlı unsurlarla ilgili yasal zorluklar ortaya koyar.

Bu nedenle, unutmak, LLM’lerin gizlilik düzenlemelerine uymasını ve telif yasalarına uymasını sağlamak için gereklidir, böylece sorumlu ve etik LLM’ler teşvik edilir.

Telif yasaları ve fikri mülkiyet hakları dosyalarını gösteren stok görsel

Ancak, bu modellerin edindiği geniş bilgi yelpazesinden telifli içeriği çıkarmak zorlu bir görevdir. Bu sorunu çözmek için bazı unutmaya yönelik teknikler vardır:

  • Veri filtreleme: Bu, modelin eğitim verisinden telifli unsurları, gürültülü veya önyargılı verileri sistematik olarak tanımlamak ve çıkarmak anlamına gelir. Ancak, filtreleme, filtreleme sırasında değerli olmayan telifli olmayan bilgilerin kaybedilmesine neden olabilir.
  • Gradyan yöntemleri: Bu yöntemler, modelin parametrelerini, kaybın gradyanına dayalı olarak ayarlayarak, ML modellerindeki telifli veri sorununu ele alır. Ancak, ayarlamalar, modelin genel performansını olumsuz etkileyebilir.
  • Bağlam içi unutmak: Bu teknik, belirli eğitim noktalarının model üzerindeki etkisini, parametrelerini güncelleyerek ve ilgili olmayan bilgileri etkilemeden ortadan kaldırır. Ancak, bu yöntem, özellikle büyük modellerde, kesin unutmaya ulaşmada sınırlamalarla karşılaşır ve etkililiğinin daha fazla değerlendirilmesi gerekir.

Bu teknikler kaynak yoğun ve zaman alıcıdır, bu nedenle uygulanması zorlaşır.

Örnek Çalışmalar

LLM unutmalarının önemini anlamak için, gerçek dünya örnekleri, şirketlerin LLM’ler ve telifli verilerle ilgili yasal zorluklarla karşı karşıya kaldığını vurgular.

OpenAI Davaları: OpenAI, bir AI şirketi, LLM’lerin eğitim verisi nedeniyle birçok dava ile karşı karşıya kaldı. Bu yasal işlemler, LLM eğitiminde telifli materyalin kullanımını sorgular ve modellerin her telifli eser için izin alma mekanizmalarını soruşturur.

Sarah Silverman Davası: Sarah Silverman davası, ChatGPT modelinin kendisine ait kitapların özetlerini izin almadan ürettiği iddiasını içerir. Bu yasal işlem, AI ve telifli veriler geleceği konusunda önemli konuları vurgular.

Yasal çerçevelerin teknolojik ilerlemelerle uyumlu hale getirilmesi, AI modellerinin sorumlu ve yasal kullanımını sağlar. Ayrıca, araştırma topluluğu bu zorlukları kapsamlı bir şekilde ele almalıdır ki LLM’ler etik ve adil olsun.

Geleneksel LLM Unutma Teknikleri

LLM unutmak, karmaşık bir tarife belirli bileşenleri ayırmak gibidir, böylece sadece istenen bileşenler nihai ürüne katkıda bulunur. Geleneksel LLM unutmak teknikleri, örneğin, ince ayarlanmış verilerle yeniden eğitme ve yeniden eğitme, telifli verilerin çıkarılması için doğrudan mekanizmalardan yoksundur.

Bu geniş yaklaşım, genellikle seçici unutmaya yönelik sofistike görev için verimsiz ve kaynak yoğundur, çünkü geniş yeniden eğitim gerektirir.

Bu geleneksel yöntemler, model parametrelerini ayarlayabilir, ancak telifli içeriği kesin olarak hedeflemek için mücadele eder ve istemeyen veri kaybı ve alt optimal uyum riski taşır.

Dolayısıyla, geleneksel tekniklerin sınırlamaları ve güçlü çözümler, alternatif unutmaya yönelik tekniklerin denenmesini gerektirir.

Yeni Teknik: Eğitim Verilerinin Bir Alt Kümesinin Unutulması

Microsoft araştırma makalesi, LLM’lerden telifli verilerin unutulmasına yönelik bir teknik sunar. Llama2-7b modeli ve Harry Potter kitapları örneğinde, yöntem, LLM’nin Harry Potter dünyasını unutmak için üç temel bileşenden oluşur:

  • Güçlendirilmiş model tanımlama: Hedef veri (örneğin, Harry Potter) için güçlendirilmiş bir model oluşturmak, bu verilerin çıkarılmasına yönelik bilgiyi güçlendirir.
  • Özgün ifadelerin değiştirilmesi: Harry Potter’ın benzersiz ifadeleri, daha genel ifadelerle değiştirilir, bu da daha genel bir anlayış sağlar.
  • Alternatif öngörülerle ince ayar: Temel model, bu alternatif öngörülere dayalı olarak ince ayarlanır, böylece orijinal metni ilgili bağlamda etkili bir şekilde siler.

Microsoft tekniği, erken bir aşamada olabilir ve sınırlamalara sahip olsa da, daha güçlü, etik ve uyumlu LLM’ler için umut verici bir ilerlemeyi temsil eder.

Yeni Tekniğin Sonuçları

LLM’lerin telifli verilerini unutmalarına yönelik yenilikçi yöntem, Microsoft araştırma makalesinde sunulmuştur ve sorumlu ve etik modellere doğru bir adımdır.

Yöntem, Meta’nın Llama2-7b modelinden Harry Potter ile ilgili içeriği silmeyi içerir, bu model “books3” veri setine dayalı olarak eğitilmiştir ve telifli eserleri içerir. Modelin orijinal yanıtları, J.K. Rowling evrenine dair karmaşık bir anlayış sergiler, generic promtlerle dahi.

Ancak, Microsoft’un önerdiği teknik, modelin yanıtlarında önemli değişikliklere neden oldu. Aşağıda, orijinal Llama2-7b modeli ile ince ayarlanmış versiyon arasındaki farkları gösteren örnek promtler bulunmaktadır.

İnce ayarlanmış promt karşılaştırması

Görsel kaynağı

Bu tablo, ince ayarlanmış unutmaya yönelik modellerin, Hellaswag, Winogrande, piqa, boolq ve arc gibi çeşitli benchmarklerde performanslarını koruduğunu gösterir.

Yeni tekniğin benchmark değerlendirmesi

Görsel kaynağı

Değerlendirme yöntemi, model promtleri ve sonraki yanıt analizine dayanır, ancak daha karmaşık, düşmanca bilgi çıkarma yöntemlerini göz ardı edebilir.

Teknik umut verici olsa da, daha da geliştirilmesi ve genişletilmesi, özellikle LLM’lerde daha geniş unutmaya yönelik görevleri ele almak için daha fazla araştırmaya ihtiyaç duyulur.

Yeni Unutma Tekniğinin Zorlukları

Microsoft’un unutmaya yönelik tekniği umut verici olsa da, AI telifli veri zorlukları ve sınırlamaları vardır.

Ana sınırlamalar ve geliştirme alanları şunları içerir:

  • Telifli bilgi sızıntıları: Yöntem, telifli bilgilerin sızıntı riskini tamamen ortadan kaldırmayabilir, çünkü model, ince ayarlanma sırasında hedef içeriğin bazı bilgilerini koruyabilir.
  • Çeşitli veri setlerinin değerlendirilmesi: Etkililiğini değerlendirmek için, teknik, yalnızca Harry Potter kitaplarına odaklanan ilk deneyden daha çeşitli veri setleri üzerinde test edilmelidir.
  • Ölçeklenebilirlik: Daha büyük veri setleri ve daha karmaşık dil modelleri üzerinde test etmek, tekniklerin gerçek dünya senaryolarında uygulanabilirliğini ve adaptasyonunu değerlendirmek için gereklidir.

AI ile ilgili yasal davaların artması, özellikle LLM’leri hedef alan telifli dava artışları, net rehberlik ihtiyacını vurgular. Microsoft’un önerdiği unutmaya yönelik yöntem gibi vaat edilen gelişmeler, etik, yasal ve sorumlu AI’ye doğru bir yol açar.

AI ve ML’deki son haberleri ve analizleri kaçırmayın – bugün unite.ai ziyaret edin.

Haziqa bir Veri Bilimcisi ve AI ve SaaS şirketleri için teknik içerik yazma konusunda geniş deneyime sahiptir.