Düşünce Liderleri
Model Geliştirme Otomasyonuna Kritik Yol

Yapay zeka araştırmaları için bir sonraki önemli kilometre taşı, model geliştirmeyi otomatikleştirmektir. Mantık, dil ve algıdaki her ilerleme,某 anlamda, bu hedefe doğru bir adımdır. Ancak, model otomasyonuna giden yol, önce çözülmesi gereken temel zorluklar gerektirir.
Bu hedefe giden köprü, doğrudan makine öğrenimi (ML) mühendisliği üzerinden geçer. ML’nin modern yapay zeka öncüsü bir teknoloji olduğu ve temel modellerin onu basitçe değiştirdiği şeklindeki yaygın bir yanlış anlama, bu ilişkinin yanlış anlaşılmasına neden olur. Bir akademik disiplin olarak ML, model eğitiminin tüm yönlerini, güncel yapay zeka anının merkezindeki temel modellerin eğitimi dahil olmak üzere kapsar. Ancak, ölçek ve veri karmaşıklığı açısından anlamlı bir fark vardır.
Geleneksel ML modelleri genellikle, binlerce veya milyonlarca örnek içeren, dikkatlice oluşturulmuş, alan spesifik veri kümelerine dayalı olarak eğitilir. Temel modeller ise, tersine, çok farklı kaynaklardan, tutarlı olmayan formatlar, köken ve kaliteye sahip binlerce veri kümesini aynı anda eğitir. Veri ölçeği ve heterojenlikteki bu fark, veri yönetimi’nin daha güçlü ve önemli hale gelmesinin temel nedenlerinden biridir.
Bu, model geliştirme otomasyonunda veri anlama’nın merkezi bir engel oluşturmasına neden olur. Veri yorumlayabilen ve etrafındaki boru hatlarını geliştirebilen bir yapay zeka sistemi, prensipte kendi eğitim sürecini geliştirebilir ve daha iyi modeller oluşturabilir. Bir kez yapay zeka, eğitildiği süreci geliştirebildiğinde, iyileştirmeler, yapay zeka’nın uygulandığı her alana doğru akar.
Engel Olan Üç Barier
İlk engel, bağlam parçalanmasıdır.几乎 her organizasyonda, belirli bir modelleme problemine ilişkin sinyaller, deneyler, özellik tanımları ve kurumsal bilgiler, birbirleriyle iletişim kurmak için tasarlanmayan veri ambarları, defterler ve boru hatları arasında dağılmıştır. Bir sağlık sistemi, sepsis algılama modeli oluşturuyor olsun. Bu probleme ilişkin klinik kriterler, such as vital eşik değerleri, laboratuvar değerleri ve belgeleme standartları, tamamen ayrı elektronik sağlık kaydı sistemlerinin modüllerinde yaşayabilir.
İkinci engel, anlamsal belirsizliktir. Anlam, verinin kendisinde değil, bağlamsal ve kurumsaldır. İki farklı veritabanındaki aynı alan adı, incelikle farklı şeylere atıfta bulunabilir. Gelir, aktif kullanıcı ve terk gibi kavramlar, tek bir şirket içinde birden fazla geçerli tanım içerebilir. Hatta “gelir” gibi görünüşte basit bir kavram bile sorunlara neden olabilir. Satış ekibi, geliri bu çeyrekte imzalanan sözleşmelerin toplam değerini olarak tanımlayabilir, mentre mali ekip, geliri gerçekten alınan nakit olarak tanımlayabilir. Ürün ekibi, terimi, abonelik dönemi boyunca tanınan geliri ifade etmek için tanımlar, ancak tümü de kendi sistemlerindeki “gelir” adlı alanlardan çekilir. Birbirini karıştıran üç farklı sayı birleştirilir.
Üçüncü ve en sistematik engel, belgelenmiş kurumsal hafızanın yokluğudur. Binlerce kaynaktan gelen verilerin kökenini izlemek, tutarsızlıkları çözmek ve kalite sinyallerini korumak, insan ekipleri için bile çözülmemiş bir problemdir. Deneyimli bir model otomasyon mekanizması, ne denendiği ve nasıl çalıştığı hakkında kurumsal bir hafızaya sahip olmadığı sürece, aynı çıkmazları yeniden keşfedecek, zaman ve kaynakları boşa harcayacaktır.
Bir perakende şirketindeki bir veri bilim ekibini düşünün, talebi tahmin etme modeli oluşturuyor olsun. Üç yıl boyunca, bir düzine analist, ham hava verisinin model performansı’nı tatil haftalarında bozduğunu, belirli bir tedarikçinin stok beslemesinin sistematik bir gecikme içerdiğini ve standard yaklaşımın hedef sızıntısına neden olduğunu bağımsız olarak keşfetti. Orijinal analistler diğer takımlara geçti veya şirketten ayrıldığında, bilgi onlarla birlikte gitti. Bir model otomasyon mekanizması, denendiği, başarısız olduğu ve neden başarısız olduğu konusunda bir kurumsal kayıt olmadan, biriken deneyimi üzerine inşa edemez. Sadece sıfırdan başlar, tekrar tekrar, gereksiz yere zaman boşa harcayarak.
Gerçek Bir Çözümün Gerektirdiği
ML otomasyonunun tarihi, kısmi çözümlerin bir tarihçesidir. AutoML, dar bir problem olan hiperparametre ayarlamasını ele aldı, ancak amaç uyuşmazlıklarını veya kurumsal niyeti hakkında akıl yürütme yapamadı. MLOps, üretim boru hatlarını daha güçlü ve daha kolay izlenebilir hale getirdi, ancak MLOps araçları bir stratejiyi uygularken, onu tanımlamaz. Daha yeni kodlama ajanları, gerçek bir ilerleme adımını temsil eder, ancak aynı körlüğü miras almışlardır. Kod üretebilirler, ancak kurumsal bağlam veya kurumsal hafıza olmadan çalışırlar.
Gerçekten otonom ML mühendisliği yeteneklerine sahip bir sistem, mevcut hiçbir araç tarafından birlikte sunulmayan yeteneklere ihtiyaç duyacaktır. İş hedeflerini model hedeflerine çevirebilmeli, bu, yalnızca verilerden çıkarılamayan bir çeviri olmalıdır. Tutarlı şemalara sahip fragmante sistemler boyunca ilgili verileri keşfedebilmeli ve otomatik olarak uyumluluk, yönetim ve güvenlik kısıtlamalarına uymalıdır, bunları ayrı bir işlem olarak insanlara yönetmek yerine. Kurumsal hafızaya ihtiyaç duyacaktır, mevcut çalışmayı ortaya çıkarmak, neden geçmiş deneylerin terk edildiğini anlamak ve meslektaşların zaten bildiği şeyleri üzerine inşa etmek için.
Veri sürümleri, özellik tanımları ve kod taahhütleri boyunca kökeni izleyen katı denetim izleri, sistemin gerçekten neler olduğu konusunda temel bir mekanizma olarak gerekli olacaktır. Ve böyle bir sistem, düşünceli bir insan-döngü tasarıma ihtiyaç duyacaktır. Tam otomasyon ve tam manuel kontrol arasında ikili bir seçim değil, görev, risk ve sistemin her karar noktasındaki güvenine bağlı olarak değişen düzeyde etkileşim desteği. Eleştirel anlarda insan yargısını atlayan otomasyon, iyi tasarlanmış yapay zeka’nın bir özelliği değil, bir hata modudur.
Henüz hiçbir laboratuvar, kurumsal verilerin anlamsal anlayışını oluşturmayı, verilerin belirli bir kurumsal bağlamda ne anlama geldiğini anlamayı çözmedi. MCP, bağlantılılık sorununu çözer. Anlam sorununu henüz çözmez. Bu, açık araştırma cephesi olarak kalır.
Ne Olabilir
Bu sorunları çözmenin ekonomik etkileri önemlidir. Özel ML geliştirme, bugün, iyi tanımlanmış sorunlar için bile, uzman uygulayıcılar ve haftalarca süren iterasyon gerektirir. Problemin tanımı, veri keşfi, model geliştirme ve model değerlendirme yoluyla tam iş akışını otomatik olarak gezebilecek bir sistem, bu denklemini dramatik bir şekilde değiştirecek, zaman çizelgelerini sıkıştıracak ve şu anda çok fazla kaynak yoğunluğuna sahip olan yüksek değerli kullanım durumlarını açacaktır. Deep ML uzmanlarının zamanını kullanmak zorunda kalmadan günlerce tamamlanabilecek projeler, önce uzman ekiplerin haftalarca çalışmasını gerektiriyordu.













