Yapay Zeka

Gemma: Google, Açık Kaynak Aracılığıyla Gelişmiş Yapay Zeka Yetenekleri Getiriyor

Yayınlanan Şubat 29, 2024

Aayush Mittal Mittal

Yapay zeka (AI) alanı, son yıllarda büyük ölçüde teknolojideki gelişmelerin etkisiyle büyük bir ilerleme kaydetti. derin öğrenme ve doğal dil işleme (NLP). Bu ilerlemelerin başında büyük dil modelleri (LLM'ler) – İnsan benzeri metinler oluşturabilen ve konuşma görevlerinde bulunabilen büyük miktarda metin verisi üzerinde eğitilmiş yapay zeka sistemleri.

Google'ın PaLM'i, Anthropic'in Claude'u ve DeepMind'ın Gopher'ı gibi LLM'ler, kodlamadan sağduyulu muhakemeye kadar olağanüstü yetenekler sergilemiştir. Ancak, bu modellerin çoğu henüz açıklanmamıştır ve bu da araştırma, geliştirme ve faydalı uygulamalar için erişimlerini sınırlamaktadır.

Bu durum, Google'ın DeepMind'ın güçlü tescilli Gemini modellerine dayanan bir LLM programı ailesi olan Gemma'nın yakın zamanda açık kaynaklı hale getirilmesiyle değişti. Bu blog yazısında, Gemma'nın mimarisini, eğitim sürecini, performansını ve sorumlu sürümünü analiz ederek Gemma'yı derinlemesine inceleyeceğiz.

Gemma'ya Genel Bakış

Şubat 2023'te DeepMind açık kaynaklı iki boyuttaki Gemma modeli – cihaz içi dağıtım için optimize edilmiş 2 milyar parametreli sürüm ve GPU/TPU kullanımı için tasarlanmış daha büyük 7 milyar parametreli sürüm.

Gemma, DeepMind'ın önde gelen Gemini modellerine benzer bir transformatör tabanlı mimari ve eğitim metodolojisinden yararlanıyor. Web belgeleri, matematik ve kodlardan oluşan 6 trilyon token'a kadar metin üzerinde eğitildi.

DeepMind, Gemma'nın hem önceden eğitilmiş ham kontrol noktalarını hem de diyalog, talimat takibi ve kodlama gibi alanlarda gelişmiş yetenekler için denetimli öğrenme ve insan geri bildirimiyle ince ayarlı sürümlerini yayınladı.

Gemma'ya Başlarken

Gemma'nın açık sürümü, gelişmiş yapay zeka yeteneklerini geliştiriciler, araştırmacılar ve meraklılar için erişilebilir hale getiriyor. İşte başlamak için hızlı bir kılavuz:

Platformdan Bağımsız Dağıtım

Gemma'nın en önemli güçlü yönlerinden biri esnekliğidir; CPU'larda, GPU'larda veya TPU'larda çalıştırabilirsiniz. CPU için TensorFlow Lite veya HuggingFace Transformers'ı kullanın. GPU/TPU'da hızlandırılmış performans için TensorFlow kullanın. Google Cloud'un Vertex AI gibi bulut hizmetleri de sorunsuz ölçekleme sağlar.

Önceden Eğitilmiş Modellere Erişim

Gemma, ihtiyaçlarınıza bağlı olarak önceden eğitilmiş farklı varyantlarla gelir. 2B ve 7B modelleri, kullanıma hazır güçlü üretken yetenekler sunar. Özel ince ayar için 2B-FT ve 7B-FT modelleri ideal başlangıç noktalarıdır.

Heyecan Verici Uygulamalar Oluşturun

Gemma ile hikaye oluşturma, dil çevirisi, soru cevaplama ve yaratıcı içerik üretimi gibi çeşitli uygulamalar geliştirebilirsiniz. Önemli olan, Gemma'nın güçlü yönlerinden kendi veri kümeleriniz üzerinde ince ayar yaparak yararlanmaktır.

mimari

Gemma, çoklu sorgu dikkati ve döner konumsal yerleştirmeler gibi ilerlemeleri temel alan, yalnızca kod çözücüye yönelik bir transformatör mimarisini kullanır:

Transformers: 2017 yılında tanıtılan, tamamen dikkat mekanizmalarına dayanan dönüştürücü mimari, NLP'de yaygınlaştı. Gemma, dönüştürücünün metindeki uzun menzilli bağımlılıkları modelleme yeteneğini miras alıyor.
Yalnızca kod çözücü: Gemma, BART veya T5 gibi kodlayıcı-kod çözücü modellerinden farklı olarak yalnızca bir transformatör kod çözücü yığını kullanır. Bu, metin oluşturma gibi görevler için güçlü üretken yetenekler sağlar.
Çoklu sorgu dikkati: Gemma, daha büyük modelinde çoklu sorgu dikkati kullanarak her dikkat kafasının daha hızlı çıkarım için birden fazla sorguyu paralel olarak işlemesine olanak tanır.
Döner konumsal yerleştirmeler: Gemma, mutlak konum kodlamaları yerine döner yerleştirmeleri kullanarak konum bilgisini temsil eder. Bu teknik, konum bilgisini korurken model boyutunu küçültür.

Çoklu sorgu dikkati ve döner konumsal yerleştirmeler gibi tekniklerin kullanılması, Gemma modellerinin performans, çıkarım hızı ve model boyutu arasında en uygun dengeye ulaşmasını sağlar.

Veri ve Eğitim Süreci

Gemma, 6 trilyon token'a kadar metin verisi üzerinde eğitildi, öncelikle İngilizce. Buna web belgeleri, matematiksel metinler ve kaynak kodu da dahildi. DeepMind, sınıflandırıcılar ve buluşsal yöntemler kullanarak veri filtreleme, toksik veya zararlı içerikleri kaldırma konusunda önemli çaba harcadı.

Eğitim, Gemma-5B'nin eğitimi için 4096'ya kadar TPU kullanılarak Google'ın TPUv7 altyapısı kullanılarak gerçekleştirildi. Verimli model ve veri paralellik teknikleri, büyük modellerin standart donanımlarla eğitilmesini mümkün kıldı.

Yüksek kaliteli, alakalı metne odaklanmak için veri dağıtımını sürekli olarak ayarlayan aşamalı eğitimden yararlanıldı. Nihai ince ayar aşamalarında, yetenekleri geliştirmek için insan tarafından oluşturulan ve sentetik talimat takip örneklerinin bir karışımı kullanıldı.

Model Performansı

DeepMind, Gemma modellerini soru cevaplama, akıl yürütme, matematik, kodlama, sağduyu ve diyalog yeteneklerini kapsayan 25'ten fazla kriterden oluşan geniş bir sette titizlikle değerlendirdi.

Gemma, kıyaslamaların çoğunda benzer büyüklükteki açık kaynak modelleriyle karşılaştırıldığında en son teknolojiye sahip sonuçlar elde ediyor. Bazı önemli noktalar:

matematik: Gemma, GSM8K ve MATH gibi matematiksel muhakeme testlerinde üstün başarı göstererek Codex ve Anthropic'in Claude gibi modellerini 10 puandan fazla geride bırakıyor.
kodlama: Gemma, kod konusunda özel olarak eğitilmemiş olmasına rağmen, MBPP gibi programlama kriterlerinde Codex'in performansıyla eşleşir veya onu aşar.
Diyalog: Gemma, insan tercihi testlerinde Anthropic'in Mistral-51.7B'sine karşı %7'lik bir galibiyet oranıyla güçlü bir konuşma yeteneği sergiliyor.
muhakeme: ARC ve Winogrande gibi çıkarım gerektiren görevlerde Gemma, diğer 7B modellerini 5-10 puan geride bırakıyor.

Gemma'nın disiplinler arası çok yönlülüğü, güçlü genel zeka yeteneklerini ortaya koymaktadır. İnsan seviyesindeki performansta hala eksiklikler olsa da, Gemma açık kaynaklı NLP'de bir sıçramayı temsil etmektedir.

Güvenlik ve Sorumluluk

Büyük modellerin açık kaynak ağırlıklarının serbest bırakılması, kasıtlı kötüye kullanım ve modelin doğasında olan önyargılar konusunda zorluklar ortaya çıkarır. DeepMind riskleri azaltmak için adımlar attı:

Veri filtreleme: Sınıflandırıcılar ve buluşsal yöntemler kullanılarak potansiyel olarak zehirli, yasa dışı veya önyargılı metinler eğitim verilerinden kaldırıldı.
Puanlar: Gemma, güvenliği, adaleti ve sağlamlığı değerlendirmek için seçilen 30'dan fazla kıyaslamada test edildi. Diğer modellerle eşleşti veya onları aştı.
İnce ayar: Modelin ince ayarı, bilgi filtreleme ve uygun korunma/reddetme davranışları gibi güvenlik yeteneklerinin geliştirilmesine odaklandı.
Kullanım Şartları: Kullanım koşulları Gemma modellerinin saldırgan, yasa dışı veya etik olmayan uygulamalarını yasaklar. Ancak uygulama halen zorludur.
Model kartları: Şeffaflığı artırmak için model yeteneklerini, sınırlamalarını ve önyargılarını detaylandıran kartlar yayınlandı.

Açık kaynak kodlu yazılımların riskleri mevcut olsa da DeepMind, Gemma'nın piyasaya sürülmesinin güvenlik profili ve araştırmayı mümkün kılması nedeniyle net toplumsal faydalar sağladığını belirledi. Ancak, olası zararların dikkatli bir şekilde izlenmesi kritik öneme sahip olmaya devam edecek.

Yapay Zeka İnovasyonunda Sonraki Dalgayı Etkinleştirmek

Gemma'nın açık kaynaklı bir model ailesi olarak piyasaya sürülmesi, yapay zeka topluluğunda ilerlemenin önünü açacak:

Erişilebilirlik: Gemma, daha önce kendi LLM'lerini eğitmek için yüksek bilgi işlem/veri maliyetleriyle karşı karşıya kalan kuruluşların son teknoloji NLP ile geliştirme yapmasının önündeki engelleri azaltıyor.
Yeni uygulamalar: DeepMind, önceden eğitilmiş ve ayarlanmış kontrol noktalarını açık kaynak olarak kullanarak eğitim, bilim ve erişilebilirlik gibi alanlarda faydalı uygulamaların daha kolay geliştirilmesini sağlar.
Özelleştirme: Geliştiriciler, özel verilerle ilgili sürekli eğitim yoluyla Gemma'yı sektöre veya alana özgü uygulamalar için daha da özelleştirebilirler.
Araştırma: Gemma gibi açık modeller, mevcut NLP sistemlerinin daha fazla şeffaflığını ve denetimini teşvik ederek gelecekteki araştırma yönlerine ışık tutar.
yenilik: Gemma gibi güçlü temel modellerin mevcudiyeti, önyargının azaltılması, gerçekçilik ve yapay zeka güvenliği gibi alanlardaki ilerlemeyi hızlandıracaktır.

DeepMind, Gemma'nın yeteneklerini açık kaynaklı hale getirerek yapay zekanın toplumsal fayda için sorumlu bir şekilde geliştirilmesini teşvik etmeyi umuyor.

Öndeki yol

Yapay zekadaki her sıçramayla birlikte, tüm alanlarda insan zekasına rakip olan veya onu aşan modellere daha da yaklaşıyoruz. Gemma gibi sistemler, kendi kendini denetleyen modellerdeki hızlı ilerlemelerin giderek daha gelişmiş bilişsel yeteneklerin kilidini açtığının altını çiziyor.

Bununla birlikte, insan zekasının hâlâ üstün olduğu alanlar olan yapay zekanın güvenilirliğini, yorumlanabilirliğini ve kontrol edilebilirliğini iyileştirmeye yönelik çalışmalar devam ediyor. Matematik gibi alanlar bu kalıcı boşlukları vurguluyor; Gemma, tahmini %64 insan performansına kıyasla MMLU'da %89 puan aldı.

Her zamankinden daha yetenekli yapay zeka sistemlerinin güvenliğini ve etiğini sağlarken bu boşlukları kapatmak önümüzdeki yılların temel zorlukları olacak. DeepMind, ortaya çıkan riskleri yönetirken yapay zekanın faydalarına erişimi demokratikleştirmeyi amaçladığından, açıklık ve ihtiyat arasında doğru dengeyi yakalamak kritik önem taşıyacak.

Yapay zeka güvenliğini teşvik etmeye yönelik girişimler – Dario Amodei'nin ANC'si, DeepMind'ın Etik ve Toplum ekibi ve Anthropic'in Anayasal Yapay Zekası gibi – bu nüans ihtiyacının giderek daha fazla kabul gördüğünün bir göstergesi. Anlamlı ilerleme, araştırmacılar, geliştiriciler, politika yapıcılar ve halk arasında açık ve kanıta dayalı bir diyalog gerektirecektir.

Sorumlu bir şekilde yönetilirse Gemma, yapay zekanın zirvesini değil, DeepMind'ın adil ve faydalı genel yapay zeka yolundaki adımlarını izleyen gelecek nesil yapay zeka araştırmacıları için bir üs teşkil ediyor.

Sonuç

DeepMind'ın Gemma modellerini yayınlaması, açık kaynaklı yapay zeka için yeni bir çağın habercisi; dar kapsamlı ölçütleri aşan, genelleştirilmiş zeka yeteneklerine sahip bir çağ. Güvenlik açısından kapsamlı bir şekilde test edilen ve geniş çapta erişilebilir olan Gemma, yapay zekada sorumlu açık kaynak kullanımı için yeni bir standart belirliyor.

İşbirlikçi değerlerle şekillenen rekabetçi bir ruhla hareket eden Gemma gibi atılımların paylaşılması, yapay zeka ekosistemindeki tüm tekneleri yükseltir. Artık tüm topluluk, girişimlerini yönlendirmek veya desteklemek için çok yönlü bir LLM ailesine erişime sahip.

Riskler devam etse de, DeepMind'ın teknik ve etik titizliği, Gemma'nın faydalarının potansiyel zararlarından daha ağır bastığına dair güven sağlıyor. Yapay zeka yetenekleri giderek daha da geliştikçe, açıklık ve temkin arasındaki bu ince ayrımı korumak kritik önem taşıyacak.

Gemma bizi tüm insanlığa fayda sağlayan yapay zekaya bir adım daha yaklaştırıyor. Ancak yardımsever yapay genel zekaya giden yolda hâlâ birçok büyük zorluk sizi bekliyor. Yapay zeka araştırmacıları, geliştiricileri ve genel olarak toplum işbirlikçi ilerlemeyi sürdürebilirse, Gemma bir gün nihai zirve yerine tarihi bir ana kamp olarak görülebilir.

İlgili konular:DeepMind Tomurcuk Yüksek Lisans

Aayush Mittal

Son beş yılımı, Makine Öğrenimi ve Derin Öğrenmenin büyüleyici dünyasına dalarak geçirdim. Tutkum ve uzmanlığım, özellikle AI/ML'ye odaklanarak 50'den fazla farklı yazılım mühendisliği projesine katkıda bulunmamı sağladı. Devam eden merakım, beni daha fazla keşfetmeye hevesli olduğum bir alan olan Doğal Dil İşleme'ye de çekti.