Yapay Zeka

Cerebras Dünyanın En Hızlı Yapay Zeka Çıkarım Çözümünü Tanıtıyor: Çok Az Maliyetle 20 Kat Hız

Yayınlanan Ağustos 27, 2024

Antoine Tardif, Unite.AI'nın CEO'su ve Kurucusu

Cerebras SistemleriYüksek performanslı yapay zeka hesaplamasında öncü olan , yapay zeka çıkarımlarında devrim yaratacak çığır açan bir çözüm sundu. 27 Ağustos 2024'te şirket, dünyanın en hızlı yapay zeka çıkarım hizmeti olan Cerebras Inference'ın lansmanını duyurdu. Geleneksel GPU tabanlı sistemleri gölgede bırakan performans ölçümleriyle Cerebras Inference, maliyetin çok altında bir maliyetle 20 kat daha fazla hız sunarak yapay zeka bilişiminde yeni bir standart belirliyor.

Eşsiz Hız ve Maliyet Verimliliği

Cerebras Inference, özellikle hızla gelişen yapay zeka segmentinde çeşitli yapay zeka modellerinde olağanüstü performans sunmak üzere tasarlandı. büyük dil modelleri (LLM'ler). Örneğin, Llama 1,800 3.1B modeli için saniyede 8 token, Llama 450 3.1B modeli için ise saniyede 70 token işliyor. Bu performans, NVIDIA GPU tabanlı çözümlerden yalnızca 20 kat daha hızlı olmakla kalmıyor, aynı zamanda önemli ölçüde daha düşük bir maliyetle de sunuluyor. Cerebras, bu hizmeti Llama 10 3.1B modeli için milyon jeton başına yalnızca 8 sentten başlayan fiyatlarla ve Llama 60 3.1B modeli için milyon jeton başına 70 sentten başlayarak sunuyor; bu, mevcut GPU tabanlı tekliflerle karşılaştırıldığında fiyat performansında 100 kat artış anlamına geliyor.

Hızın Sınırlarını Zorlarken Doğruluğu Korumak

Cerebras Inference'ın en etkileyici yönlerinden biri, eşsiz hız sunarken en son teknoloji doğruluğunu koruma yeteneğidir. Hız için hassasiyeti feda eden diğer yaklaşımlardan farklı olarak Cerebras'ın çözümü, çıkarım çalışmasının tamamı boyunca 16 bitlik alanda kalıyor. Bu, performans kazanımlarının, hassasiyete odaklanan geliştiriciler için çok önemli bir faktör olan yapay zeka modeli çıktılarının kalitesinden ödün verilmemesini sağlar.

Yapay Analiz Kurucu Ortağı ve CEO'su Micah Hill-Smith, bu başarının önemini vurguladı: "Cerebras, Meta'nın Llama 3.1 8B ve 70B AI modelleri için GPU tabanlı çözümlerden çok daha hızlı hızlar sağlıyor. Llama 1,800 3.1B'de saniyede 8 çıkış tokeninin üzerindeki hızları ve Llama 446 3.1B'de saniyede 70 çıkış tokeninin üzerindeki hızları ölçüyoruz; bu kriterlerde yeni bir rekor."

Yapay Zeka Çıkarımının Artan Önemi

Yapay zeka çıkarımı Yapay zeka bilişiminin en hızlı büyüyen segmentidir ve toplam yapay zeka donanım pazarının yaklaşık %40'ını oluşturur. Cerebras'ın sunduğu gibi yüksek hızlı yapay zeka çıkarımının ortaya çıkışı, geniş bant internetin kullanıma sunulmasına benzer; yeni fırsatların kilidini açar ve yapay zeka uygulamaları için yeni bir çağın habercisi olur. Cerebras Inference ile geliştiriciler artık yapay zeka aracıları ve akıllı sistemler gibi karmaşık, gerçek zamanlı performans gerektiren yeni nesil yapay zeka uygulamaları geliştirebiliyor.

DeepLearning.AI Kurucusu Andrew Ng, yapay zeka gelişiminde hızın öneminin altını çizdi: "DeepLearning.AI, bir sonuç almak için LLM'nin tekrar tekrar yönlendirilmesini gerektiren birden fazla aracılı iş akışına sahiptir. Cerebras, bu tür iş yüklerine çok yardımcı olacak, etkileyici derecede hızlı bir çıkarım yeteneği geliştirmiştir.başlıklı bir kılavuz yayınladı

Geniş Endüstri Desteği ve Stratejik Ortaklıklar

Cerebras, sektör liderlerinden güçlü destek aldı ve yapay zeka uygulamalarının gelişimini hızlandırmak için stratejik ortaklıklar kurdu. Cerebras'ın ilk müşterilerinden GlaxoSmithKline'ın Yapay Zeka/Öğrenme Kıdemli Başkan Yardımcısı Kim Branson, bu teknolojinin dönüştürücü potansiyelini vurguladı: “Hız ve ölçek her şeyi değiştirir.”

LiveKit gibi diğer şirketler şaşkınlıkve Meter, Cerebras Inference'ın operasyonları üzerinde yaratacağı etki konusundaki heyecanlarını da dile getirdi. Bu şirketler, daha duyarlı, insan benzeri yapay zeka deneyimleri oluşturmak, arama motorlarındaki kullanıcı etkileşimini geliştirmek ve ağ yönetim sistemlerini geliştirmek için Cerebras'ın bilgi işlem yeteneklerinin gücünden yararlanıyor.

Cerebras Çıkarımı: Katmanlar ve Erişilebilirlik

Cerebras Inference, rekabetçi fiyatlara sahip üç katmanda mevcuttur: Ücretsiz, Geliştirici ve Kurumsal. Ücretsiz Kullanım, cömert kullanım limitleriyle ücretsiz API erişimi sağlayarak geniş bir kullanıcı yelpazesinin erişimine sunar. Geliştirici Katmanı, Llama 3.1 modellerinin milyon token başına 10 sent ve 60 sent olarak fiyatlandırıldığı esnek, sunucusuz bir dağıtım seçeneği sunar. Kurumsal Katman, ince ayarlı modeller, özel hizmet düzeyi anlaşmaları ve özel destek sunarak, sürekli iş yükü olan kuruluşlara hitap eder ve talep üzerine fiyatlandırma yapılabilir.

Cerebras Çıkarımına Güç Vermek: Gofret Ölçeği Motoru 3 (WSE-3)

Cerebras Inference'ın kalbinde, endüstri lideri Wafer Scale Engine 3 (WSE-3) tarafından desteklenen Cerebras CS-3 sistemi bulunmaktadır. Bu AI işlemci, boyutu ve hızı açısından benzersizdir ve NVIDIA H7,000'den 100 kat daha fazla bellek bant genişliği sunar. WSE-3'ün devasa ölçeği, birçok eşzamanlı kullanıcıyı yönetebilmesini sağlayarak performanstan ödün vermeden olağanüstü hızlar sağlar. Bu mimari, Cerebras'ın genellikle GPU tabanlı sistemleri rahatsız eden ödünleşimlerden kaçınmasına ve yapay zeka iş yükleri için sınıfının en iyi performansını sunmasına olanak tanıyor.

Kusursuz Entegrasyon ve Geliştirici Dostu API

Cerebras Inference, geliştiriciler düşünülerek tasarlanmıştır. OpenAI Sohbet Tamamlama API'si ile tam uyumlu bir API'ye sahiptir ve minimum kod değişikliğiyle kolay geçişe olanak tanır. Bu geliştirici dostu yaklaşım, Cerebras Inference'ın mevcut iş akışlarına entegre edilmesinin mümkün olduğu kadar kusursuz olmasını sağlayarak, yüksek performanslı yapay zeka uygulamalarının hızlı bir şekilde devreye alınmasını sağlar.

Cerebras Systems: Endüstriler Arasında İnovasyonu Desteklemek

Cerebras Systems, yalnızca yapay zeka bilişiminde lider değil aynı zamanda sağlık, enerji, hükümet, bilimsel bilişim ve finansal hizmetler de dahil olmak üzere çeşitli sektörlerde önemli bir oyuncudur. Şirketin çözümleri, Ulusal Laboratuvarlar, Aleph Alpha, Mayo Kliniği ve GlaxoSmithKline gibi kurumlarda çığır açan buluşlara öncülük etmede etkili oldu.

Cerebras, benzersiz hız, ölçeklenebilirlik ve doğruluk sağlayarak bu sektörlerdeki kuruluşların yapay zeka ve ötesindeki en zorlu sorunlardan bazılarının üstesinden gelmesine olanak tanıyor. İster sağlık hizmetlerinde ilaç keşfini hızlandırmak, ister bilimsel araştırmalarda hesaplama yeteneklerini geliştirmek olsun, Cerebras inovasyonu yönlendirmede ön saflarda yer alıyor.

Sonuç: Yapay Zeka Çıkarımı için Yeni Bir Dönem

Cerebras Systems, Cerebras Inference'ın piyasaya sürülmesiyle yapay zeka çıkarımı için yeni bir standart belirliyor. Cerebras, geleneksel GPU tabanlı sistemlere göre 20 kat daha fazla hızı çok düşük bir maliyetle sunarak yalnızca yapay zekayı daha erişilebilir hale getirmekle kalmıyor, aynı zamanda yeni nesil yapay zeka uygulamalarının da önünü açıyor. Cerebras, ileri teknolojisi, stratejik ortaklıkları ve yeniliğe olan bağlılığıyla yapay zeka endüstrisini benzeri görülmemiş performans ve ölçeklenebilirlik içeren yeni bir çağa taşımaya hazırlanıyor.

Cerebras Sistemleri hakkında daha fazla bilgi edinmek ve Cerebras Çıkarımını denemek için şu adresi ziyaret edin: www.cerebras.ai.

İlgili konular:Cerebras

Bir sonraki

Google Üç Yeni Deneysel Gemini Modelini Yayınladı

Kaçırmayın

Yapay Zeka Dil Gösterisi: C++, Python, Java ve Rust'un Performansını Karşılaştırma

Antoine Tardif

Antoine, yapay zeka ve robotiğin geleceğini şekillendirme ve tanıtma konusunda sarsılmaz bir tutkuyla hareket eden vizyon sahibi bir lider ve Unite.AI'nin kurucu ortağıdır. Bir seri girişimci olan Antoine, yapay zekanın toplum için elektrik kadar yıkıcı olacağına inanır ve sıklıkla yıkıcı teknolojilerin ve AGI'nin potansiyeli hakkında övgüler yağdırırken yakalanır.

Olarak fütürist, bu yeniliklerin dünyamızı nasıl şekillendireceğini keşfetmeye adamıştır. Ayrıca, kurucusudur menkul kıymetler.ioGeleceği yeniden tanımlayan ve tüm sektörleri yeniden şekillendiren son teknolojiye yatırım yapmaya odaklanan bir platform.

Unite.AI