Röportajlar
Xavier Conort, FeatureByte’nin Kurucu Ortağı ve CPO’su – Röportaj Serisi

Xavier Conort 25 yıldan fazla veri deneyimine sahip bir vizyoner veri bilimcisidir. Sigorta endüstrisinde aktüer olarak kariyerine başlayan Conort, daha sonra veri bilimine geçti. Kaggle’de üst sıralarda yer alan bir yarışmacı ve DataRobot’ta Baş Veri Bilimcisi oldu, ardından FeatureByte’i kurdu.
FeatureByte şirketinin misyonu, kurumsal AI’ı ölçeklendirerek AI veriğini radikal bir şekilde basitleştirmek ve endüstrileştirmektir. Özellik mühendisliği ve yönetim platformu, veri bilimcilerin state-of-the-art özellikler ve üretim hazır veri boru hatlarını dakikalar içinde, haftalar veya aylar yerine oluşturup paylaşmalarını sağlar.
Kariyerinize sigorta endüstrisinde aktüer olarak başladınız, daha sonra Veri Bilimine geçtiniz, bu geçişi ne gây etti?
Bir dönüm noktası, GE’nin düzenlediği 250.000 $’lık ödül havuzu ile US iç hat uçuşlarındaki gecikmeleri tahmin etme yarışması olan GE Flight Quest’i kazanmak oldu. Bu başarının bir kısmını, yeterli temsil edilmeyen eğitim verilerine sahip özelliklerdeki önyargıyı kontrol etmeye yardımcı olan 2 aşamalı modelleme gibi değerli sigorta uygulamalarına borçluyum. Kaggle’deki diğer zaferlerimle birlikte bu başarı, veri bilimi alanındaki rekabet avantajıma sahip olduğumu bana kanıtladı.
Kaggle yolculuğum sırasında, DataRobot’un kurucuları olan Jeremy Achin ve Tom De Godoy gibi diğer tutkulu veri bilimcileriyle bağlantı kurma ayrıcalığını da yaşadım. Sigorta geçmişimiz ve Kaggle’deki önemli başarılarımız vardı. DataRobot’u, AutoML uzmanlaşmış bir şirket olarak lanç ettiklerinde, beni Baş Veri Bilimcisi olarak katılmaya davet ettiler. Sigorta endüstrisinin en iyi uygulamalarını makine öğrenimi gücünü birleştiren vizyonları beni heyecanlandırdı ve yenilikçi ve etkili bir şey yaratma fırsatı sundu.
DataRobot’ta Veri Bilim Yol Haritasını inşa etmede önemli bir rol oynadınız. Hangi tür veri zorluklarıyla karşılaştınız?
Karşılaştığımız en önemli zorluk, AutoML çözümümüze girdi olarak verilen verilerin değişen kalitesi idi. Bu sorun, ekibimiz ve müşterilerimiz arasında zaman alıcı işbirliği veya üretim aşamasında uygun şekilde ele alınmazsa hayal kırıklığı yaratan sonuçlara yol açabiliyordu. Kalite sorunları birden fazla kaynaktan kaynaklanıyordu ve dikkatimizi gerektiriyordu.
Veri hazırlama ve yönetim için iş zekası araçlarının genel kullanımı, birincil zorluklardan biriydi. Bu araçlar, içgörüler oluşturmak için değerli olsa da, makine öğrenimi veri hazırlama için gerekli yeteneklere sahip değildir. Sonuç olarak, eğitim verilerine sızıntılar meydana gelebilir, bu da aşırı uyumu ve model performansının yanlış olmasına yol açabilir.
Veri bilimcileri ve veri mühendisleri arasındaki yanlış iletişim, üretim aşamasında model performansını etkileyen bir başka zorluktu. Bu iki takım arasındaki uyumsuzluk, gerçek dünya ortamında model performansını etkileyebiliyordu.
Bu deneyimden bazı önemli çıkarımlar nelerdi?
DataRobot’taki deneyimim, makine öğrenimi中的 veri hazırlamanın önemini vurguladı. Model eğitim verilerini oluşturma zorluklarını, yani nokta-zamansal doğruluk, uzmanlık açıkları, alan bilgisi, araç sınırlamaları ve ölçeklenebilirlik gibi sorunları ele alarak, makine öğrenimi modellerinin doğruluğunu ve güvenilirliğini artırabiliriz. Veri hazırlama sürecini basitleştirmek ve yenilikçi teknolojileri entegre etmek, AI’ın vaatlerini yerine getirmek ve tam potansiyelini açığa çıkarmak için çok önemlidir.
Co-Kurucu Razi Raziuddin’den FeatureByte’nin köken hikayesini dinledik, olayların sizin versiyonunuzu alabilir miyiz?
Gözlemlerimi ve içgörülerimi Co-Kurucu Razi Raziuddin ile paylaştığımda, makine öğrenimi için veri hazırlama zorluklarını anlamada ortak bir anlayışa sahip olduğumuzu fark ettik. Tartışmalarımızda, MLOps topluluğundaki recent gelişmeleri paylaştım. Özellik depoları ve özellik platformlarının, AI-first teknoloji şirketleri tarafından özellik sunma gecikmesini azaltmak, özellik yeniden kullanımını teşvik etmek veya eğitim verilerine özellik maddelemesini basitleştirmek için nasıl kurulduğunu gözlemledim. Ancak, veri bilimcilerinin ihtiyaçlarını karşılayan bir boşluk olduğunu açıkça görebiliyorduk. Razi, modern veri yığınının BI ve analitiği nasıl devrimcileştirdiğini, ancak AI için tam olarak kullanılmadığını paylaştı.
Hem Razi hem ben, özellik mühendisliği sürecini radikal bir şekilde basitleştirmek ve veri bilimcilerine ve ML mühendislerine özellik deneyimi ve özellik sunma için uygun araçlar ve kullanıcı deneyimi sağlamak için önemli bir etki yaratma fırsatına sahip olduğumuzu fark ettik.
Veri bilimcisinden girişimciye geçişin en büyük zorlukları nelerdi?
Veri bilimcisinden girişimciye geçmek, teknik bir perspektiften daha geniş bir iş odaklı zihniyete geçmek anlamına geliyordu. Pain point’leri anlamak, yol haritası oluşturmak, planları uygulamak, ekibi inşa etmek ve bütçeleri yönetmek gibi güçlü bir temelime sahip olsam da, hedef kitlemle真正 bir şekilde rezonansa giren doğru mesajı oluşturmak, benim için en büyük zorluklardan biri oldu.
Bir veri bilimcisi olarak, odak noktam her zaman verilerini analiz etmek ve değerli içgörüler elde etmekti. Ancak bir girişimci olarak, düşünme şeklimi pazar, müşteriler ve genel iş odaklı olarak değiştirmem gerekti.
Şükürler olsun ki, bu zorluğu, benim gibi bir ortak olan Co-Kurucu Razi’nin deneyimi sayesinde aşabildim.
Razi’den özellik mühendisliğinin neden bu kadar zor olduğunu dinledik, sizin görüşünüz nedir?
Özellik mühendisliği iki ana zorluk içerir:
- Mevcut sütunları dönüştürme: Bu, veri bilim algoritmaları için uygun bir formata dönüştürmeyi içerir. Birleştirme, özellik ölçekleme ve metin ve resim dönüşümleri gibi teknikler kullanılır. Mevcut sütunlardan yeni özellikler oluşturmak, model performansını önemli ölçüde artırabilir. Popüler kütüphaneler gibi scikit-learn ve Hugging Face, bu tür özellik mühendisliği için geniş destek sağlar. AutoML çözümleri de bu süreci basitleştirmeyi amaçlar.
- Tarihsel verilerden yeni sütunlar çıkarma: Tarihsel veriler, öneri sistemleri, pazarlama, dolandırıcılık algılama, sigorta fiyatlandırması, kredi puanlaması, talep tahmini ve sensör verileri işleme gibi problem alanlarında çok önemlidir. Bu verilerden bilgilendirici sütunlar çıkarmak zorlu bir iştir. Son olaydan bu yana geçen süre, yakın olaylar üzerinde toplamlar ve olay dizilerinden gömme gibi örnekler içerir. Bu tür özellik mühendisliği, alan uzmanlığı, deneysellik, güçlü kodlama ve veri mühendisliği becerileri ve derin veri bilimi bilgisini gerektirir. Zaman sızıntısı, büyük veri kümelerini işleme ve verimli kod yürütme gibi faktörler de dikkate alınmalıdır.
Genel olarak, özellik mühendisliği uzmanlık, deneysellik ve karmaşık özel veri boru hatlarının inşasını gerektirir ve bu tür araçlar olmadan.
FeatureByte’nin veri bilimcilerini nasıl güçlendirdiğini ve özellik boru hatlarını basitleştirdiğini paylaşabilir misiniz?
FeatureByte, özellik mühendisliği sürecini basitleştirerek veri bilimcilerini güçlendirir. XLarge Event ve Item Tablolarından hızlı özellik oluşturma ve çıkarma sağlayan bir Python SDK’si sunar. Hesaplama, Snowflake, DataBricks ve Spark gibi veri platformlarının ölçeklenebilirliğini kullanarak verimli bir şekilde ele alınır. Defterler deneyselliği kolaylaştırırken, özellik paylaşımı ve yeniden kullanımı zaman kazandırır. Denetim, özellik doğruluğunu sağlar ve anında dağıtım, boru hattı yönetiminden kaynaklanan baş ağrılarını ortadan kaldırır.
Açık kaynak kütüphanemiz tarafından sunulan bu yeteneklere ek olarak, kurumsal çözümümüz, AI operasyonlarını ölçeklendirerek yönetmek için kapsamlı bir çerçeve sunar, bu da yönetim işlemlerini ve özellik kataloğu için bir kullanıcı arayüzünü içerir.
FeatureByte’nin geleceği için vizyonunuz nedir?
FeatureByte’nin geleceği için ultimate vizyonumuz, veri bilimcilerinin tam yaratıcı potansiyellerini açığa çıkarmak ve veri varlıklarından önce görülmemiş bir değer elde etmektir.
Generatif AI ve transformer’lerin hızlı ilerlemesinden özellikle heyecan duyuyoruz, bu da kullanıcılarımız için yeni olanaklar açar. Ayrıca, özellik mühendisliğini demokratikleştirmeye adanmışız. Generatif AI, yaratıcı özellik mühendisliğini daha geniş bir kitle için daha erişilebilir hale getirebilir.
Özetle, FeatureByte’nin geleceği için vizyonumuz, sürekli inovasyon, Generatif AI’nin gücünü kullanmak ve özellik mühendisliğini demokratikleştirmek etrafında dönüyor. Makine öğrenimi için ham veriyi eyleme geçirilebilir girdiye dönüştüren, çeşitli endüstrilerde yenilikler ve ilerlemeler sağlayan gitmek istediğimiz platform olmak istiyoruz.
Aspirin AI girişimcilerine herhangi bir tavsiyeniz var mı?
Alanınızı tanımlayın, odaklanın ve yeniliği karşılayın.
Tanımladığınız alanda kendinizi farklılaştırarak ve güçlü bir varlık oluşturarak, kendinizi ayırt edebilirsiniz. Pazarı araştırın, potansiyel müşterilerin ihtiyaçlarını ve ağrı noktalarını anlayın ve bu zorlukları etkili bir şekilde çözen benzersiz bir çözüm sunmaya çalışın.
Uzun vadeli vizyonunuzu tanımlayın ve bu vizyona uygun kısa vadeli hedefler belirleyin. Güçlü bir temel oluşturmak ve seçtiğiniz alanda değer sağlamak üzerine odaklanın.
Son olarak, odaklanmak önemlidir, ancak yeniliği benimsemekten ve tanımladığınız alanda yeni fikirleri keşfetmekten kaçınmayın. AI alanı sürekli evrim geçiriyor ve yenilikçi yaklaşımlar yeni fırsatlar açabilir.
Harika röportaj için teşekkür ederiz, daha fazla bilgi edinmek isteyen okuyucular FeatureByte ziyaret edebilir.












