Connect with us

Yubei Chen, Aizip Inc’in Kurucu Ortağı – Röportaj Serisi

Röportajlar

Yubei Chen, Aizip Inc’in Kurucu Ortağı – Röportaj Serisi

mm

Yubei Chen Aizip inc.’in kurucu ortağıdır. Aizip, dünyanın en küçük ve en verimli AI modellerini geliştiren bir şirkettir. Ayrıca California, Davis Üniversitesi’nin ECE Departmanında yardımcı profesördür. Chen’in araştırmaları, hesaplamalı nörobilimi ve derin gözetimsiz (kendini gözetimli) öğrenme arasındaki kesişmede yer almaktadır. Bu araştırmalar, beynin ve makinelerin unsupervised temsil öğrenimi üzerindeki hesaplamalı ilkelerin anlaşılmasını geliştirmekte ve doğal sinyal istatistiklerine ilişkin görüşlerimizi yeniden şekillendirmektedir.

UC Davis’e katılmadan önce, Chen, NYU Center for Data Science (CDS) ve Meta Fundamental AI Research (FAIR) bünyesinde Prof. Yann LeCun ile doktora sonrası nghiênmasını tamamladı. Berkeley’deki Redwood Center for Theoretical Neuroscience ve Berkeley AI Research (BAIR) bünyesinde Prof. Bruno Olshausen’in rehberliğinde doktorasını tamamladı.

Aizip, kenar cihazlar için optimize edilmiş ultra verimli AI çözümleri geliştirmektedir. Görüntü, ses, zaman serisi, dil ve sensör füzyon uygulamaları için kompakt modeller sunmaktadır. Ürünleri, yüz ve nesne tanıma, anahtar kelime tanıma, ECG/EEG analizi ve cihaz içi sohbet botları gibi görevleri gerçekleştirmektedir. Tüm bunlar TinyML tarafından desteklenmektedir. AI nanofactory platformu Aizipline aracılığıyla, şirket temel ve generatif modelleri kullanarak AI tasarım otomasyonuna doğru ilerlemeyi hızlandırmaktadır. Aizip’in Gizmo serisi küçük dil modelleri (300M-2B parametre), geniş bir cihaz yelpazesini desteklemektedir ve kenara zeka yetenekleri getirmektedir.

Siz Yann LeCun ile NYU ve Meta FAIR’de doktora sonrası araştırmanızı yaptınız. Onunla çalışmak ve UC Berkeley’deki araştırmanız, gerçek dünya AI çözümlerini oluşturma yaklaşiminizi nasıl şekillendirdi?

Berkeley’de, çalışmalarım derinlemesine bilimsel sorgulama ve matematiksel titizlik üzerine kuruluydu. Doktora araştırğim, elektrik mühendisliği, bilgisayar bilimi ve hesaplamalı nörobilimi birleştirdi ve AI sistemlerini “beyaz kutu” perspektifinden anlamaya odaklandı. Veri ve öğrenme modellerinin altındaki yapıları ortaya çıkaran yöntemler geliştirdim. Yorumlanabilir, yüksek performanslı AI modelleri ve görselleştirme teknikleri üzerine çalıştım ve bunlar siyah kutu AI sistemlerini açığa çıkarmaya yardımcı oldu.

Meta FAIR’de odak, ölçeklerde state-of-the-art performans đạtmak için AI sistemlerini mühendislik yapmak üzerineydi. Dünya sınıfı hesaplama kaynaklarına erişimim vardı ve self-supervised öğrenmenin sınırlarını keşfettim ve şimdi “dünya modelleri” olarak adlandırdığımız şeylere katkıda bulundum — veri ve olası ortamları öğrenen AI sistemleri. Bu çift deneyim — Berkeley’de bilimsel anlayış ve Meta’da mühendislik odaklı ölçeklendirme — AI geliştirme üzerine kapsamlı bir perspektif kazandırdı. Hem teorik içgörünün hem de pratik uygulamanın gerçek dünya uygulamalarında AI çözümleri geliştirirken ne kadar önemli olduğunu vurguladı.

Çalışmanız hesaplamalı nörobilimi AI ile birleştiriyor. Nörobilimden elde edilen içgörüler AI modellerinin geliştirilme şeklini nasıl etkiliyor?

Hesaplamalı nörobilimde, beynin bilgiyi nasıl işlediğini çeşitli uyaranlara verdiği yanıtları ölçerek incelemekteyiz. Bu, AI modellerinin iç mekanizmalarını anlamak için onları sorgulamaya benzer. Kariyerimin başlarında, kelime gömme tekniklerini analiz etmek için görselleştirme teknikleri geliştirdim. Daha sonra bu yaklaşım, transformerler ve büyük dil modelleri gibi daha karmaşık AI modellerine genişledi ve onların bilgiyi nasıl işlediğini ve depoladığını ortaya çıkarmaya yardımcı oldu.

Bu yöntemler aslında nörobilimde kullanılan tekniklere paralel gitmektedir. Örneğin, beyin aktivitesini incelemek için elektrotlar veya fMRI kullanmak gibi. Bir AI modelinin iç temsilini sorgulamak, onun akıl yürütme stratejilerini anlamak ve ortaya çıkan özellikleri, belirli fikirleri (örneğin Golden Gate Bridge özelliğini) aktive eden kavram nöronlarını tespit etmek için olanak sağlar. Bu araştırma çizgisi şimdi endüstride yaygın olarak benimsenmiştir çünkü hem yorumlanabilirliği hem de pratik müdahaleleri mümkün kılmaktadır. Böylece AI modellerinden önyargıları kaldırmaktadır. Nörobilime dayalı yaklaşımlar esasen AI’yi daha açıklanabilir, güvenilir ve verimli hale getirmeye yardımcı olmaktadır.

Aizip’i kurmaya ne teşvik etti? Şirketin kurulmasından itibaren yolculuğu hakkında bilgi verebilir misiniz?

Temel AI araştırmacısı olarak, çalışmalarımın çoğu teorikti, ancak araştırmayla gerçek dünya uygulamaları arasındaki boşluğu kapatmak istedim. Aizip’i, özellikle kaynak kısıtlı ortamlarda, AI yeniliklerini pratik kullanıma taşımak için kurdum. Büyük temel modeller inşa etmek yerine, dünyanın en küçük ve en verimli AI modellerini geliştirmeye odaklandık.

Yolculuk esasen bir ana gözlemle başladı: AI ilerlemeleri hızla ölçekleniyordu, ancak gerçek dünya uygulamaları genellikle hafif ve yüksek verimli modellere ihtiyaç duyuyordu. Bilimsel titizlik ile pratik dağıtım arasında bir dengeyi hedefledik. Kendini gözetimli öğrenme ve kompakt model mimarilerinden elde edilen içgörüler kullanarak, Aizip, kenarda yüksek verimlilikle çalışan AI çözümleri sunmayı başardı. Bu, gömülü sistemler, IoT ve ötesi için yeni olanaklar açtı.

Aizip, kenar cihazlar için küçük AI modellerine odaklanıyor. Pazarın bu alandaki boşluğunu nasıl tespit ettiniz?

AI endüstrisi büyük ölçüde modelleri ölçeklendirme üzerinde odaklandı, ancak gerçek dünya uygulamaları genellikle tam tersini talep etmektedir — yüksek verimlilik, düşük güç tüketimi ve minimal gecikme. Bugün birçok AI modeli, küçük, gömülü cihazlarda dağıtıma uygun değildir. Pazarın, güçlü performans sunarken aşırı kaynak kısıtlamalarında çalışan AI çözümlerine ihtiyaç duyduğu boşluğu gördük.

Her AI uygulamasının devasa modeller üzerinde çalışması gerekmediğini ve bu tür modellere her şey için güvenilmesinin ne gereksiz ne de ölçeklenebilir olacağını fark ettik. Bunun yerine, algoritmaları maksimum verimlilikte tutarak doğruluğu koruma üzerinde odaklandık. Kenar uygulamaları için — akıllı sensörler, giyilebilir cihazlar veya endüstriyel otomasyon gibi — AI modellerini tasarlayarak, AI’yi geleneksel modellerin pratik olmayacağı yerlerde çalıştırabiliyoruz. Yaklaşımlarımız, AI’yi daha erişilebilir, ölçeklenebilir ve enerji verimli hale getirerek, bulut ötesinde AI driven yenilikler için yeni olanaklar sunmaktadır.

Aizip, Küçük Dil Modelleri (SLM) geliştirmede ön planda yer alıyor. SLM’lerin daha büyük modellerle nasıl rekabet ettiğini veya onları tamamladığını görüyorsunuz?

SLM’ler ve daha büyük modeller gibi GPT-4 arasında doğrudan bir rekabet yoktur, çünkü farklı ihtiyaçları karşılarlar. Daha büyük modeller, genellemeler ve derin akıl yürütme açısından güçlüdür, ancak önemli hesaplama kaynakları gerektirir. SLM’ler, verimlilik ve kenar cihazlarda dağıtım için tasarlanmıştır. Büyük modelleri, AI yeteneklerini gerçek zamanlı, yerel zeka ile kenarda sunarak tamamlarlar — IoT cihazları, giyilebilir cihazlar veya endüstriyel otomasyon gibi alanlarda. AI benimsemesi arttıkça, büyük, bulut tabanlı modellerin karmaşık sorguları işlerken, SLM’lerin kenarda gerçek zamanlı zeka sağladığı bir melez yaklaşım ortaya çıkmasını bekliyoruz.

Düşük güçteki kenar cihazlar için AI modellerini yeterli derecede verimli hale getirmenin en büyük teknik zorlukları nelerdir?

Temel bir zorluk, AI modellerinin nasıl çalıştığına dair eksiksiz bir teorik anlayışın eksikliğidir. Net bir teorik temel olmadan, optimize çabaları genellikle empiriktir, bu da verimlilik kazançlarını sınırlamaktadır. Ayrıca, insan öğrenimi çeşitli şekillerde gerçekleşir ve mevcut makine öğrenimi paradigmaları bunu tam olarak yakalayamaz, bu da insan verimliliğini taklit eden modeller tasarlamayı zorlaştırır.

Mühendislik açısından, AI’yi aşırı kısıtlamalar içinde çalıştırma ihtiyacı, model sıkıştırma, kuantizasyon ve mimari tasarımında yenilikçi çözümler gerektirmektedir. Bir başka zorluk, AI modellerinin çeşitli cihazlara ve ortamlara uyum sağlarken robustluğunu korumasını sağlamaktır. AI, IoT ve sensörler aracılığıyla fiziksel dünya ile etkileşime girdikçe, doğal ve verimli arayüzlerin — ses, jest ve diğer gelenek dışı girişlerin — ihtiyacı kritik hale gelmektedir. Kenardaki AI, kullanıcıların dijital dünya ile nasıl etkileşimde bulunduğunu yeniden tanımlamaktır.

Aizip’in Softbank gibi şirketlerle yaptığı çalışmalardan bazı detaylar paylaşabilir misiniz?

Softbank ile bir aquakültür projesi üzerinde çalıştık ve bu proje CES İnovasyon Ödülü’nü kazandı — bu bizim için özellikle gurur verici bir başarı. Bir balık sayma uygulaması için kenar tabanlı bir AI modeli geliştirdik ve bu, aquakültür operatörleri tarafından balık çiftliklerinde kullanılabiliyor. Bu çözüm, balık çiftçiliği endüstrisinde sürdürülebilirlik, gıda israfı ve karlılık sorunlarına yol açabilecek kritik bir zorluğu ele alıyor. Endüstrinin AI’yi bir çözüm olarak benimsemesi, özellikle denizde güvenilebilir güç ve bağlantı eksikliği nedeniyle bulut tabanlı AI çözümlerinin pratik olmaması nedeniyle yavaş ilerlemiştir.

Çözümü geliştirmek için, Softbank’in bilgisayar grafikleri simülasyonlarını eğitim verileri olarak kullandık ve kompakt AI modellerimizi birleştirdik. Yüksek doğrulukta bir sistem yarattık ve bu sistem akıllı telefonlarda çalışmaktadır. Su altı alan testlerinde %95 tanıma oranına ulaştı ve balık sayma doğruluğunu dramatik bir şekilde iyileştirdi. Bu, çiftçilerin depolama koşullarını optimize etmelerine, balıkların canlı veya dondurularak taşınması gerekip gerekmediğini belirlemelerine ve balıklarda olası hastalıkları veya diğer sağlık sorunlarını tespit etmelerine olanak sağladı.

Bu đột phá, verimliliği artırdı, maliyetleri düşürdü ve manuel emeğe bağımlılığı azalttı. Daha geniş bir perspektiften, AI’nin gerçek dünya sorunlarına somut bir etki yaratabileceğini gösterdi.

Aizip, “AI Nanofactory” kavramını tanıttı. Bu nedir ve AI model geliştirmesini nasıl otomatikleştirir?

AI Nanofactory, bizim iç AI Tasarım Otomasyonu pipeline’mizdir ve yarı iletken üretimindeki Electronic Design Automation (EDA)’den esinlenilmiştir. Her bir yeni teknoloji alanındaki erken gelişim, önemli manuel çaba gerektirir, bu nedenle ilerlemeyi hızlandırmak ve çözümleri ölçeklemek için otomasyon anahtardır.

AI’nin kendi gelişimini hızlandırabileceğini sorduk. AI Nanofactory, AI model geliştirme sürecinin her aşamasını — veri işlemeden mimari tasarımına, model seçimi, eğitim, kuantizasyon, dağıtım ve hata ayıklamaya kadar — otomatikleştirmektedir. AI’yi kendi kendine optimize ederek, yeni modellerin geliştirme süresini ortalama 10 kat azaltmayı başardık. Bazı durumlarda, geliştirme süresini 1.000 kata kadar azalttık. Bu, bir yıl süren bir model geliştirme sürecini birkaç saat içinde gerçekleştirebilmemizi sağlar.

Bir başka avantaj, bu otomasyonun AI çözümlerinin ekonomik olarak uygulanabilir olmasını sağlar, böylece gerçek dünya AI dağıtımı daha erişilebilir ve ölçeklenebilir hale gelir.

Gelecek beş yıl içinde kenar AI’nin rolünün nasıl evrileceğini görüyorsunuz?

Kenar AI, teknolojimizle nasıl etkileşimde bulunduğunu değiştirecek, tıpkı akıllı telefonların internet erişimini devrimleştirmesi gibi. Bugün çoğu AI uygulaması bulut tabanlıdır, ancak AI fiziksel dünya ile etkileşime giren sensörler ve cihazlara yaklaştıkça bu durum değişmektedir. Bu kayma, kenarda gerçek zamanlı işlemenin önemini vurgulamaktadır.

Gelecek beş yıl içinde, kenar AI’nin daha doğal insan-bilgisayar etkileşimlerini mümkün kılmasını bekliyoruz — ses ve jest tanıma gibi ve diğer gelenek dışı arayüzler. Bu, klavye ve dokunmatik ekran gibi geleneksel engellerin ortadan kalkmasını sağlayacaktır. AI, akıllı evler veya endüstriyel otomasyon gibi günlük ortamlarda daha da gömülü hale gelecek ve gerçek zamanlı karar almaya olanak tanıyacaktır.

Bir başka önemli trend, kenar AI sistemlerinin artan özerkliği olacaktır. AI modelleri, AI Nanofactory tarzı otomasyon sayesinde daha kendini optimize eden ve adapte olabilen bir hal alacaktır, bu da dağıtım ve bakım sırasında insan müdahalesini azaltacaktır. Bu, sağlık, otomotiv ve tarım gibi birçok endüstride yeni fırsatlar açacaktır.

Aizip’ten en çok heyecan duyduğunuz AI destekli cihazlar hangileri?

Yeni endüstrilerde modellerimizin kullanım örneklerini genişletmeye çalışıyoruz ve özellikle heyecan duyduğumuz bir alan, otomotiv sektörü için bir AI Ajansıdır. Özellikle Çinli otomobil üreticileri arasında, ChatGPT gibi hissetiren, ancak araç içi çalışan ses asistanlarına yönelik bir ilgi artışı var. Ancak mevcut asistanların çoğu, özellikle esnek ve doğal diyalog için buluta güvenmektedir.

Aizip’in Gizmo serisi ultra verimli, SLM güçlendirilmiş AI ajanlarını geliştirdik ve bunları araç içi “ko-pilot” olarak kullanmak için çalışıyoruz. Gizmo, niyeti daha nüanslı bir şekilde anlamak üzere eğitilmiştir ve bir araç için AI Ajansı olarak görev yaptığı zaman, konuşma diliyle komutları gerçekleştirebilir. Örneğin, sürücü “Üşüdüm” dediğinde, kabin sıcaklığını ayarlayabilir veya “Yarın Boston’a gidiyorum, ne giymeliyim?” gibi bir talebe, hava durumunu kontrol ederek öneride bulunabilir.

Çünkü bunlar buluta değil, yerel olarak çalışırlar, ölü bölgelerde veya bağlantıların zayıf olduğu yerlerde — tüneller, dağlar veya kırsal yollar gibi — bile işlevlerini sürdürürler. Ayrıca, sürücülere tam dikkatlerini yolda tutarak, ses temelli kontrolleri sağlar ve güvenliği artırır. Ayrıca, araç içi bir AI destekli karaoke modelini ve bluetooth hoparlörler için bir modeli üretiyoruz. Bu, herhangi bir girdi sesinden insan sesini çıkararak, herhangi bir şarkının karaoke versiyonunu gerçek zamanlı olarak oluşturabilir.

Bu tür çözümler, insanların günlük hayatlarında anlamlı bir fark yaratanlardır ve biz bunları geliştirmekten gurur duyuyoruz.

Aizip, kenar cihazlar için optimize edilmiş ultra verimli AI çözümleri geliştirmektedir. Görüntü, ses, zaman serisi, dil ve sensör füzyon uygulamaları için kompakt modeller sunmaktadır. Ürünleri, yüz ve nesne tanıma, anahtar kelime tanıma, ECG/EEG analizi ve cihaz içi sohbet botları gibi görevleri gerçekleştirmektedir. Tüm bunlar TinyML tarafından desteklenmektedir. AI nanofactory platformu Aizipline aracılığıyla, şirket temel ve generatif modelleri kullanarak AI tasarım otomasyonuna doğru ilerlemeyi hızlandırmaktadır. Aizip’in Gizmo serisi küçük dil modelleri (300M-2B parametre), geniş bir cihaz yelpazesini desteklemektedir ve kenara zeka yetenekleri getirmektedir.

Harika röportaj için teşekkür ederiz, daha fazla bilgi edinmek isteyen okuyucular Aizip sitesini ziyaret edebilirler.

Antoine bir vizyoner lider ve Unite.AI'in kurucu ortağıdır ve AI ve robotik geleceğini şekillendirmek ve tanıtmak için sarsılmaz bir tutkuyla hareket etmektedir. Bir seri girişimci olarak, toplum için elektrik kadar yıkıcı olacağına inandığı AI'nin potansiyeli hakkında sık sık konuşur ve coşkusunu dile getirir.
Bir futurist olarak, bu yeniliklerin dünyamızı nasıl şekillendireceğini keşfetmeye adanmıştır. Ayrıca, Securities.io kurucusudur, bu platform geleceği yeniden tanımlayan ve tüm sektörleri yeniden şekillendiren teknolojilere yatırım yapmaya odaklanmıştır.