Yapay Zeka

Cep Boyutunda Güç Merkezi: Telefonunuza Uygun Dil Modeli olan Microsoft'un Phi-3'ü Tanıtılıyor

Yayınlanan 29 Nisan 2024

Dr. Tehseen Zia

Hızla gelişen yapay zeka alanında trend çoğu zaman daha büyük ve karmaşık modellere yönelirken Microsoft, Phi-3 Mini ile farklı bir yaklaşım benimsiyor. Bu küçük dil modeli (SLM)Artık üçüncü neslinde olan , daha büyük modellerin sağlam yeteneklerini akıllı telefonların katı kaynak kısıtlamalarına uyan bir çerçeveye sığdırıyor. 3.8 milyar parametreyle Phi-3 Mini, performansıyla eşleşiyor büyük dil modelleri (LLM'ler) dil işleme, akıl yürütme, kodlama ve matematik dahil olmak üzere çeşitli görevlerde kullanılır ve niceleme yoluyla mobil cihazlarda verimli çalışma için uyarlanmıştır.

Büyük Dil Modellerinin Zorlukları

Microsoft'un Phi SLM'lerinin geliştirilmesi, tüketici cihazlarında genellikle mevcut olandan daha fazla hesaplama gücü gerektiren LLM'lerin ortaya koyduğu önemli zorluklara bir yanıt niteliğindedir. Bu yüksek talep, standart bilgisayarlarda ve mobil cihazlarda kullanımlarını zorlaştırmakta, eğitim ve işletim sırasında enerji tüketimleri nedeniyle çevresel endişelere yol açmakta ve büyük ve karmaşık eğitim veri kümeleriyle önyargıların devam etmesine neden olmaktadır. Bu faktörler ayrıca modellerin gerçek zamanlı uygulamalardaki yanıt verebilirliğini olumsuz etkileyebilir ve güncellemeleri daha zor hale getirebilir.

Phi-3 Mini: Gelişmiş Gizlilik ve Verimlilik için Kişisel Cihazlarda Yapay Zekayı Kolaylaştırma

MKS Phi-3 Mini gelişmiş yapay zekayı doğrudan telefon ve dizüstü bilgisayar gibi kişisel cihazlara entegre etmek için uygun maliyetli ve verimli bir alternatif sunmak üzere stratejik olarak tasarlanmıştır. Bu tasarım, günlük senaryolarda kullanıcının teknolojiyle etkileşimini geliştirerek daha hızlı ve anında yanıt verilmesini kolaylaştırır.

Phi-3 Mini, gelişmiş yapay zeka işlevlerinin doğrudan mobil cihazlarda işlenmesini sağlayarak bulut hizmetlerine olan bağımlılığı azaltır ve gerçek zamanlı veri işlemeyi geliştirir. Bu özellik, mobil sağlık, gerçek zamanlı dil çevirisi ve kişiselleştirilmiş eğitim gibi anında veri işleme gerektiren uygulamalar için hayati önem taşır ve bu alanlardaki ilerlemeleri kolaylaştırır. Modelin maliyet etkinliği, operasyonel maliyetleri düşürmenin yanı sıra giyilebilir teknoloji ve ev otomasyonu gibi gelişmekte olan pazarlar da dahil olmak üzere çeşitli sektörlerde yapay zeka entegrasyon potansiyelini de artırır. Phi-3 Mini, kullanıcı gizliliğini artıran yerel cihazlarda doğrudan veri işleme olanağı sağlar. Bu, kişisel sağlık ve finansal hizmetler gibi alanlarda hassas bilgilerin yönetimi için hayati önem taşıyabilir. Dahası, modelin düşük enerji gereksinimleri, küresel sürdürülebilirlik çabalarıyla uyumlu, çevresel olarak sürdürülebilir yapay zeka operasyonlarına katkıda bulunur.

Tasarım Felsefesi ve Phi'nin Evrimi

Phi'nin tasarım felsefesi kavramına dayanmaktadır. müfredat öğrenmeÇocukların giderek daha zorlayıcı örneklerle öğrendiği eğitim yaklaşımından ilham alan. Ana fikir, yapay zeka eğitimine daha kolay örneklerle başlamak ve öğrenme süreci ilerledikçe eğitim verilerinin karmaşıklığını kademeli olarak artırmaktır. Microsoft, bu eğitim stratejisini, kendi çalışmasında da detaylandırıldığı gibi, ders kitaplarından bir veri kümesi oluşturarak hayata geçirmiştir:İhtiyacınız Olan Tek Şey Ders Kitaplarıdır.” Phi serisi, 2023 milyar parametreye sahip kompakt bir model olan Phi-1 ile başlayarak Haziran 1.3'te piyasaya sürüldü. Bu model, özellikle daha büyük, daha karmaşık modellerden daha iyi performans gösterdiği Python kodlama görevlerinde etkinliğini hızlı bir şekilde gösterdi. Bu başarının üzerine Microsoft son zamanlarda şunları geliştirdi: Phi-1.5Aynı sayıda parametreyi koruyan ancak sağduyulu muhakeme ve dil anlama gibi alanlardaki yeteneklerini genişleten. Dizi yayınlandıktan sonra gölgede kaldı Phi-2 2023 milyar parametreyle Phi-2.7, akıl yürütme ve dil anlama konusunda etkileyici beceriler sergileyerek onu çok daha büyük modellere karşı güçlü bir rakip olarak konumlandırdı.

Phi-3 ve Diğer Küçük Dil Modelleri

Önceki modellerini genişleten Phi-3 Mini, diğer SLM'leri geride bırakarak Phi-2'nin ilerlemelerini genişletiyor. Google'ın Gemma'sı, Mistral'in Mistral'i, Meta'nın Llama3-Talimatları, ve GPT3.5, çeşitli endüstriyel uygulamalarda. Bu uygulamalar, dil anlama ve çıkarım, genel bilgi, sağduyulu akıl yürütme, ilkokul matematik sözcük problemleri ve tıbbi soru yanıtlamayı içerir ve bu modellere kıyasla üstün performans sergiler. Phi-3 Mini ayrıca içerik oluşturma ve belirli konumlara özel etkinlik önerileri sağlama gibi çeşitli görevler için iPhone 14 üzerinde çevrimdışı testlerden de geçti. Bu amaçla Phi-3 Mini adı verilen bir işlem kullanılarak 1.8GB'a sıkıştırılmıştır. niceleme, modelin sayısal verilerini 32 bitlik kayan nokta sayılarından 4 bitlik tam sayılar gibi daha kompakt biçimlere dönüştürerek modeli sınırlı kaynaklı cihazlar için optimize eder. Bu, modelin bellek alanını azaltmanın yanı sıra mobil cihazlar için hayati önem taşıyan işlem hızını ve güç verimliliğini de artırır. Geliştiriciler genellikle şu gibi çerçeveleri kullanır: TensorFlow Lite or PyTorch Mobil, bu süreci otomatikleştirmek ve iyileştirmek için yerleşik niceleme araçlarını içerir.

Özellik Karşılaştırması: Phi-3 Mini ve Phi-2 Mini

Aşağıda Phi-3'ün bazı özelliklerini selefi Phi-2 ile karşılaştırıyoruz.

Model Mimarisi: Phi-2, bir sonraki kelimeyi tahmin etmek için tasarlanmış transformatör tabanlı bir mimari üzerinde çalışır. Phi-3 Mini ayrıca bir transformatör kod çözücü mimarisi kullanır ancak 2 sözcük dağarcığı boyutuna sahip aynı tokenizer'ı kullanarak Llama-320,641 model yapısına daha yakın uyum sağlar. Bu uyumluluk, Llama-2 için geliştirilen araçların Phi-3 Mini ile kullanıma kolayca uyarlanabilmesini sağlar.
Bağlam Uzunluğu: Phi-3 Mini, Phi-8,000'nin 2 jetonundan oldukça daha büyük olan 2,048 jetonluk bağlam uzunluğunu destekler. Bu artış, Phi-3 Mini'nin daha ayrıntılı etkileşimleri yönetmesine ve daha uzun metinleri işlemesine olanak tanır.
Mobil Cihazlarda Yerel Olarak Çalıştırma: Phi-3 Mini, Phi-4'ye benzer şekilde yaklaşık 1.8 GB bellek kaplayarak 2 bit'e sıkıştırılabilir. A14 Bionic çipli bir iPhone 16'te çevrimdışı çalışırken test edildi ve burada Phi-12'nin benzer koşullardaki performansıyla eşleşecek şekilde saniyede 2 jetonun üzerinde bir işlem hızına ulaştı.
Model Boyut: 3.8 milyar parametreli Phi-3 Mini, 2 milyar parametreli Phi-2.7'den daha büyük bir ölçeğe sahiptir. Bu, artan yeteneklerini yansıtıyor.
Eğitim verileri: 2 trilyon jetonla eğitilmiş Phi-1.4'den farklı olarak Phi-3 Mini, 3.3 trilyonluk çok daha büyük bir jeton seti üzerinde eğitilmiş olup, karmaşık dil kalıplarını daha iyi kavramasını sağlar.

Phi-3 Mini'nin Sınırlamalarını Ele Alma

Phi-3 Mini, küçük dil modelleri alanında önemli ilerlemeler sergilerken, sınırlamaları da yok değil. Devasa dil modelleriyle karşılaştırıldığında daha küçük boyutu göz önüne alındığında, Phi-3 Mini'nin birincil kısıtlaması, kapsamlı gerçek bilgiyi depolama kapasitesinin sınırlı olmasıdır. Bu, belirli somut verilerin derinliğini veya ayrıntılı uzman bilgisini gerektiren sorguları bağımsız olarak ele alma yeteneğini etkileyebilir. Ancak bu durum Phi-3 Mini'nin bir arama motoruyla entegre edilmesiyle azaltılabilir. Bu şekilde model, gerçek zamanlı olarak daha geniş bir bilgi yelpazesine erişebilir ve kendi doğasındaki bilgi sınırlamalarını etkili bir şekilde telafi edebilir. Bu entegrasyon, Phi-3 Mini'nin, kapsamlı bir dil ve bağlam kavrayışına rağmen, doğru ve güncel yanıtlar sağlamak için ara sıra bilgilere "arama" ihtiyacı duyabilen, son derece yetenekli bir konuşmacı gibi işlev görmesini sağlar.

Uygunluk

Phi-3 artık çeşitli platformlarda mevcut: Microsoft Azure Yapay Zeka Stüdyosu, Sarılma Yüz, ve Ollama. Azure AI'da model, konuşlandırma-değerlendirme-ince ayar iş akışını içerir ve Ollama'da dizüstü bilgisayarlarda yerel olarak çalıştırılabilir. Model bunun için özel olarak tasarlandı ONNX Çalışma Zamanı ve destekler Windows DirectMLGPU'lar, CPU'lar ve mobil cihazlar gibi çeşitli donanım türlerinde iyi çalışmasını sağlamak. Ayrıca Phi-3, mikro hizmet olarak da sunulmaktadır. NVIDIA NIMFarklı ortamlarda kolay dağıtım için standart bir API ile donatılmıştır ve özellikle NVIDIA GPU'lar için optimize edilmiştir. Microsoft, Phi-3-small (3B) ve Phi-7-medium (3B) modellerini ekleyerek yakın gelecekte Phi-14 serisini daha da genişletmeyi planlıyor ve kullanıcılara kalite ve maliyeti dengelemek için ek seçenekler sunuyor.

Alt çizgi

Microsoft'un Phi-3 Mini'si, büyük dil modellerinin gücünü mobil kullanıma uyarlayarak yapay zeka alanında önemli adımlar atıyor. Bu model, daha hızlı ve gerçek zamanlı işlem ve gelişmiş gizlilik özellikleriyle kullanıcıların cihazlarla etkileşimini iyileştiriyor. Bulut tabanlı hizmetlere olan ihtiyacı en aza indirerek operasyonel maliyetleri düşürüyor ve sağlık ve ev otomasyonu gibi alanlarda yapay zeka uygulamalarının kapsamını genişletiyor. Müfredat öğrenimi yoluyla önyargıları azaltmaya ve rekabetçi performansı korumaya odaklanan Phi-3 Mini, verimli ve sürdürülebilir mobil yapay zeka için önemli bir araca dönüşüyor ve teknolojiyle günlük etkileşim biçimimizi gizlice dönüştürüyor.