Connect with us

Alex Ratner, Snorkel AI’nin CEO’su ve Kurucu Ortağı – Röportaj Serisi

Röportajlar

Alex Ratner, Snorkel AI’nin CEO’su ve Kurucu Ortağı – Röportaj Serisi

mm

Alex Ratner, Snorkel AI‘nin CEO’su ve kurucu ortağıdır, bu şirket Stanford AI laboratuvarından doğmuştur.

Snorkel AI yapay zeka geliştirmeyi hızlı ve pratik hale getirerek manuel yapay zeka geliştirme süreçlerini programatik çözümlere dönüştürür. Snorkel AI, şirketlerin özel veri ve bilgilerini kullanarak benzersiz iş yükleri için 10-100 kat daha hızlı çalışabilen yapay zeka geliştirmelerine olanak tanır.

İlk olarak bilgisayara ne çekti sizi?

Bilgisayar biliminde gençken iki çok heyecan verici yön vardır. Birincisi, öğretmenden beklemek zorunda kalmadan istediğin hızda öğrenmen ve inşa etmen mümkündür, çünkü anlık geri bildirim alırsın. İkincisi, kimseden izin almadan çok şey inşa edebilirsin!

Ben genç bir çocukken bu nedenlerle programlamaya başladım. Ayrıca gerektirdiği kesinliği sevdim. Karmaşık süreçleri ve rutinleri soyutlama ve sonra modüler bir şekilde kodlama işlemini keyif aldım.

Daha sonra, bir yetişkin olarak, bir danışmanlık işinde patent korpusunun temel analizleri için komut dosyaları yazma görevi verildiğinde profesyonel olarak bilgisayar bilimine geri döndüm. İnsanların patent olarak değerlendirdiği her şeyin -her şeyin- kolayca erişilebilir olmasına rağmen, basit analizleri bile yapmak için çok zor olduğu için bu kadar çok insan bilgisinin mevcut olmasına şaşırdım. kompleks teknik metin ve çok modlu veriler.

Bu, beni geri getirdi ve sonunda Stanford’da NLP (Doğal Dil İşleme) alanına odaklanarak yüksek lisans eğitimime götürdü, bu da doğal dilde ML/AI kullanma alanıdır.

Stanford’da Snorkel açık kaynak projesini başlattınız ve yönettiniz, bu erken günlerin yolculuğunu bize anlatabilir misiniz?

O zamanlar endüstride birçok kişi gibi yeni algoritmalar geliştirme -yani tüm “fancy” makine öğrenimi şeyleri- üzerine odaklandık ve toplulukta araştırma yaptık ve makaleler yayınladık.

Ancak her zaman gerçek dünya sorunlarına bağlı kalmaya çok kararlıydık -çoğunlukla Stanford’daki doktorlar ve bilim adamlarıyla-. Ancak her yeni model veya algoritma sunduğumuzda, cevap “tabii ki, deneyeceğiz, ancak sahip olmadığımız tüm bu etiketli eğitim verilerini yaratmak zorunda kalacağız!” oluyordu.

Veri etiketleme ve bu eğitim verilerini düzenleme sürecinin büyük ve konuşulmayan bir problem olduğunu gördük -bu da Snorkel projesi ve “veri odaklı AI” fikrinin nasıl başladığını gösteriyor.

Snorkel, veri odaklı bir AI yaklaşımı sunuyor, bu nedir ve model odaklı AI geliştirmesinden nasıl farklıdır?

Veri odaklı AI, daha iyi veri oluşturarak daha iyi modeller oluşturmayı hedefler.

Bu, model odaklı AI ile zıttır ancak onunla el ele çalışır. Model odaklı AI’de, veri bilimcileri veya araştırmacılar verilerin statik olduğunu varsayar ve daha iyi sonuçlar elde etmek için model mimarilerini ve parametrelerini ayarlamaya odaklanırlar.

Araştırmacılar hala model odaklı AI’de harika işler yapıyorlar, ancak raftan alınan modeller ve otomatik ML teknikleri üretim zamanında o kadar iyileştirildi ki model seçimi ticarileştirildi. Bu durumda bu modelleri iyileştirmenin en iyi yolu onlara daha iyi ve daha fazla veri sağlamaktır.

Veri odaklı AI yaklaşiminin temel ilkeleri nelerdir?

Veri odaklı AI’nin temel ilkesi basittir: daha iyi veri, daha iyi modeller oluşturur.

Akademik çalışmalarımızda buna “veri programlama” dedik. Fikir, yeterli örnek girdi ve beklenen çıktılar verilen güçlü bir modele, bu kalıpları çoğaltmayı öğreneceğidir.

Bu, beklediğinizden daha büyük bir zorluk sunar. Verilerin büyük çoğunluğu etiketsizdir -veya en azından uygulamanız için faydalı etiketler yoktur-. Verileri elle etiketlemek monotonluk, zaman ve insan çabası gerektirir.

Etiketli bir veri kümesine sahip olmak, kalitenin garantisi değildir. İnsan hatası her yerde ortaya çıkar. Her yanlış örnek, nihai modelin performansını bozar. Parametre ayarlamasının bu gerçeği gizlemesi mümkün değildir. Araştırmacılar, temel açık kaynak veri kümelerinde bile yanlış etiketlenmiş kayıtlar bulmuşlardır.

Veri Odaklı AI’nin programatik olması nedir?

Verileri manuel olarak etiketlemek ciddi zorluklar sunar. Bunun için çok insan saati gerekir ve bu saatler bazen pahalı olabilir. Tıbbi belgeler, yalnızca doktorlar tarafından etiketlenebilir.

Ayrıca, manuel etiketleme sprint’leri genellikle tek kullanımlık projelere dönüşür. Etiketleyiciler, esnek bir şema göre verilere etiketler ekler. Bir şirketin ihtiyaçları değişirse ve farklı bir etiket kümesi gerektirirse, etiketleyiciler tekrar sıfırdan başlamalıdır.

Programatik veri odaklı AI yaklaşımları bu sorunların her ikisini de minimize eder. Snorkel AI’nin programatik etiketleme sistemi, miras alınan modellerden, mevcut etiketlerden ve dış bilgi tabanlarına kadar çeşitli sinyalleri entegre ederek büyük ölçekli olasılıklı etiketler geliştirir. Birincil sinyal kaynağımız, uzmanlar ve veri bilimcileri arasındaki işbirliğinden gelir. Uzmanlar, uzman yargılarını ölçeklenebilir kurallara kodlayarak etiketleme fonksiyonları oluşturur. Bu, bir kararın etkisi onlarca veya yüzlerce veri noktasını etkilemesini sağlar.

Bu çerçeve aynı zamanda esnektir. İş ihtiyaçları değiştiğinde, kullanıcılar etiketleme fonksiyonlarını ekler, kaldırır veya ayarlayarak yeni etiketler uygulayabilir. Bu, günler yerine saatler içinde yapılır.

Bu veri odaklı yaklaşım, etiketsiz verilerin hızlı ölçeklenmesini nasıl sağlar?

Programatik veri odaklı AI yaklaşımımız, her seçimin etkisini artırarak etiketsiz verilerin hızlı ölçeklenmesini sağlar. Uzmanlar, küçük bir temel gerçek kümesi oluşturduktan sonra, veri bilimcilerle hızlı bir şekilde işbirliği yapmaya başlarlar. Etiketleme fonksiyonlarını tanımlar, hızlı bir model eğitir, etiketleme fonksiyonlarının etkisini analiz eder ve sonra etiketleme fonksiyonlarını gerektiği gibi ekler, kaldırır veya ayarlar.

Her döngü, model performansını geliştirir ve proje hedeflerine ulaşana kadar devam eder. Bu, aylarca sürebilecek veri etiketleme işini sadece birkaç saate indirgeyebilir. Bir Snorkel araştırma projesinde, iki araştırmacı, manuel etiketleyicilerin on hafta veya daha uzun sürebileceği bir hacimde, 20.000 belgeyi tek bir günde etiketledi.

Snorkel, Snorkel Flow, Snorkel GenGlow ve Snorkel Foundry dahil olmak üzere birden fazla AI çözümü sunuyor. Bu teklifler arasındaki farklar nelerdir?

Snorkel AI suiti, kullanıcıların dakika içinde milyonlarca veri noktasını programatik olarak etiketlemek için etiketleme fonksiyonları (örneğin, belgelerde anahtar kelimeler veya kalıplar arama) oluşturmasına olanak tanır, bu da manuel olarak tek bir veri noktasını etiketlemekten daha hızlıdır.

Şirketlerin özel verilerini üretimready modellere dönüştürmek ve bunlardan değer elde etmeye başlamak için gereken zamanı sıkıştırır. Snorkel AI, şirketlerin insan-merkezli yaklaşımları ölçeklendirerek, insan yargısını ve uzman bilgisi dahil etmesini sağlar.

Bu, daha şeffaf ve açıklanabilir AI’ye yol açar ve şirketlerin önyargıları yönetmesine ve sorumlu sonuçlar sunmasına olanak tanır.

Ayrıntılara inersek, Snorkel AI, Fortune 500 şirketlerine:

  • Modelleri eğitmek veya RAG’yi iyileştirmek için yüksek kaliteli etiketli veri geliştirmelerine olanak tanır;
  • İyi ayarlamayla LLM’leri özelleştirmelerine olanak tanır;
  • LLM’leri çok daha küçük ve çalıştırması daha ucuz özel modellere damıtmalarına olanak tanır;
  • Ön eğitimle alan ve görev özgüllüğü olan LLM’ler oluşturmalarına olanak tanır.

Sizce en önemli makaleniz hangisi?

Anahtar makalelerden biri, veri programlama (eğitim verilerini programatik olarak etiketleme) ve Snorkel üzerine olan makaleydi.

Snorkel için gelecekteki vizyonunuz nedir?

Snorkel’in, AI ile ciddi olan tüm büyük şirketler için güvenilir bir ortak haline gelmesini hayal ediyorum.

Snorkel Flow, büyük şirketlerdeki veri bilimcileri için evrensel bir araç olmalıdır -ya da şirketler, organizasyonları için özel büyük dil modellerini ince ayarlıyor olsunlar, resim sınıflandırma modelleri oluşturuyor olsunlar veya basit, dağıtılabilir lojistik regresyon modelleri oluşturuyor olsunlar.

Her tür modeli benötiren bir iş için, bu modelleri eğitmek için yüksek kaliteli etiketli veri gerekecektir.

Harika bir röportaj için teşekkür ederiz, daha fazla bilgi edinmek isteyen okuyucular Snorkel AI‘yi ziyaret edebilir,

Antoine bir vizyoner lider ve Unite.AI'in kurucu ortağıdır ve AI ve robotik geleceğini şekillendirmek ve tanıtmak için sarsılmaz bir tutkuyla hareket etmektedir. Bir seri girişimci olarak, toplum için elektrik kadar yıkıcı olacağına inandığı AI'nin potansiyeli hakkında sık sık konuşur ve coşkusunu dile getirir.
Bir futurist olarak, bu yeniliklerin dünyamızı nasıl şekillendireceğini keşfetmeye adanmıştır. Ayrıca, Securities.io kurucusudur, bu platform geleceği yeniden tanımlayan ve tüm sektörleri yeniden şekillendiren teknolojilere yatırım yapmaya odaklanmıştır.