Connect with us

Veri Kalitesi İşletme AI’nin Başarılı Olup Olmadığını Belirler

Düşünce Liderleri

Veri Kalitesi İşletme AI’nin Başarılı Olup Olmadığını Belirler

mm

OpenAI’nin 2022’nin sonlarında ChatGPT’yi piyasaya sürmesinden bu yana, her şirket AI ile daha hızlı ilerlemeye çalışıyor. Büyük donanım oyuncuları gibi Nvidia, şimdiye kadar olduğundan daha fazla GPU satarken, büyük model oluşturucular gibi OpenAI ve Anthropic daha da büyük modeller inşa etmeye devam ediyor.

Ancak, en gelişmiş modellere ve en büyük bütçelere rağmen, birçok AI projesi hala başarısız oluyor. Sağlık hizmetlerinden ulaşıma, finansa ve daha fazlasına kadar birçok endüstri boyunca bunu gördük. Sebep uzak değil: AI, eğitim aldığı ve gerçek zamanlı olarak aldığı verilerin sadece kadar iyidir. Bu veriler kötü şekilde etiketlenmiş, eskimiş veya eksik olduğunda, hiçbir model tutarlı veya güvenilir sonuçlar üretemez.

Ve bu, bugün birçok şirketin karşılaştığı büyük bir sorun. AI araçlarına ağır olarak yatırım yaparken, veri sistemleri dağınık ve güvensiz kalıyor. Sonuç, bir ilerleme illüzyonu. Modeller etkileyici cevaplar üretirken, içgörüler souvent zayıftır. AI başarısına gerçek engel model performansı değil, veri kalitesidir.

İyi Veri Gerçekten Ne Anlama Geliyor

Yüksek kaliteli veri sadece doğrulukla ilgili değil. Bu, güncel, eksiksiz ve eldeki problema ilgili olan bilgi anlamına geliyor. Bir müşterinin bir e-ticaret sitesinde siparişini iptal etmeye çalıştığını hayal edin. Sistem, sipariş ayrıntılarını, sevkiyat durumunu ve ödeme kaydını kontrol etmesi gerekir. Bu veri noktalarından herhangi biri birbirleriyle konuşmayan farklı sistemlerde yaşıyorsa, AI asistanı yararlı bir cevap veremez.

İyi veri bu noktaları anında bağlar. AI’ye bir resmin tamamını rather than fragmanlarını görme izni verir. Kötü veri, modelin tahmin etmesine neden olur. Ve AI tahmin etmeye başladığında, para maliyeti ve güveni zarara uğratan hatalar yapar. Recent örnekler, böyle varsayımların ne kadar tehlikeli olabileceğini gösteriyor.

New York City’nin iş sohbet botu güncellenmemiş veya eksik yasal bilgilere dayanarak yasadışı tavsiyeler verdi. Air Canada’nın müşteri hizmetleri botu şirket politikasından bağlam eksikliği nedeniyle yanlış geri ödeme iddiaları yaptı. Hatta büyük işe alım sistemleri, önyargılı veya yanlış etiketlenmiş verilere dayanarak adayları yanlış şekilde filtreledi, EEOC’nin ilk AI ile ilgili uzlaşması gibi. Bu başarısızlıklar sadece teknik değil. Bunlar itibari ve mali başarısızlıklardır ve bunlar, güvensiz verilere dayanan AI sistemlerinden kaynaklanmaktadır.

Endüstri çalışmaları bu sorunun kapsamını doğruluyor. Gartner, AI projelerinin %80’inin kötü veri kalitesi ve yönetiminden dolayı ölçeklenmediğini rapor ediyor. Benzer şekilde, bir MIT Sloan Management Review anketi, veri sorunlarının, algoritmalar değil, işletme AI projelerinin çökmesinin en önemli nedeni olduğunu buldu.

Kültür Kod kadar Önemlidir

Veri kalitesini iyileştirmek, tek bir araç veya komutla çözülebilecek bir şey değil. Bir kültürel değişim gerektirir. Bu nedenle, iş liderleri veriyi, bakım ve hesap verebilirlik gerektiren canlı bir sistem olarak tedavi etmelidir. Bu, sadece “verileri iyileştirmek istediğini” beyan etmek değil — bu yeterli değil. Organizasyonun her parçası, bilginin nasıl hareket ettiğini, kimi sahip olduğunu ve değiştiğinde ne olduğunu anlamalıdır.

Gerçek dünya sistemlerinde bunun nasıl oynandığını gördük. Çok sayıda AI uygulaması gece veri güncellemelerine güveniyor. Veritabanınız günde bir kez yenilenirse, modelin bilgisi gerçeklikten her zaman geride kalacaktır. Hızlı değişen ortamlarda, bu gecikme eskimiş içgörüler ve kötü kararlar anlamına gelebilir. Şirketler, verilerin nasıl toplandığından, modelde nasıl teslim edildiğine kadar tüm veri akışını yeniden düşünmelidir.

Bunu iyi yapmak, enormous zaman ve maliyet tasarrufu sağlayabilir. Veri boru hatları, açıklık ve amaçla tasarlandığında, AI sistemleri en güncel ve ilgili bilgilere öğrenme ve eylem alma yeteneğine sahiptir. Dezavantajı, ekiplerin verilerini temizlemek için kullanmaktan daha fazla zaman harcamasıdır.

Veri yönetimi uzmanları, güçlü veri kalitesinin anahtarının, insanlar, süreçler ve platformlar arasında bir geri bildirim döngüsü olduğunu sık sık vurguluyor. Bu döngü olmadan, bilgi eskimiş hale gelir ve modeller gerçek dünya koşullarından kopar — bazen veri sürüklenmesi olarak adlandırılan bir sorun.

Hız ile Bütünlüğü Dengeler

Hızlı hareket etmek ve doğru kalmak arasında souvent bir gerilim vardır. Çok sayıda organizasyon, AI yatırımlarından anında sonuçlar istiyor, ancak acele etmek daha büyük sorunlara neden olabilir. Hedef, veri esnekliği ile bütünlüğü olmalıdır. Diğer bir deyişle, hızlı hareket edebilen ancak doğruluğunu kaybetmeyen sistemler oluşturmak.

Bu noktada, her şirketin, verilerin kaynağından modele gerçek zamanlı olarak akması için net yollar tanımlaması gerekir. Ayrıca, hangi bilginin girilebileceği ve hangisinin dışarıda kalması gerektiği tanımlamak da yardımcı olur. Hassas veya özel veriler, modelde asla yer almamalıdır, hatta kullanıcı teknik olarak erişimi olsa bile. Bu sınırı korumak, güveni oluşturur ve AI sistemlerinin bilgi sızdırmasını veya suistimal etmesini önler.

AI daha otonom hale geldikçe, insan denetimi kritik olacaktır. Model, iş eylemlerinin tam kontrolüne sahip olmamalıdır. Kararlar da yapmamalıdır. Bunun yerine, taleplerde bulunmalıdır. Daha da önemlisi, insanların modelin eylemlerini incelemesi ve şirket politikası ve düzenlemesiyle uyumlu olup olmadığını onaylaması gerekir.

Kaliteyi Temelden Yapılandırmak

Büyük ölçekli veri kalitesini korumak, sadece hataları temizlemekle ilgili değil. Mimariden başlar. En güvenilir verilerin nerede yaşadığını tanımlamanız ve sonra bunları birleştirerek güvenilir bir konumda tasarimanız gerekir. Oradan, modelin hangi verilerini kullandığını ve nereden geldiğini izleyebilirsiniz.

Bu yaklaşım, karışıklığı önler ve sistemi şeffaf tutar. Ayrıca, bir şeyler yanlış gittiğinde, ekiplerin daha hızlı sorun gidermesini sağlar. Modelin cevabını hangi verilerin beslediğini tam olarak bildiğinizde, sorunları yayılmadan önce doğrulayabilir ve düzeltebilirsiniz.

Kurumsal AI’nin geleceği, kaliteyi altyapısına varsayılan olarak entegre eden şirketlere ait olacaktır. AI ve veri entegrasyonunu bir pakette ele alan daha fazla plug-and-play AI sistemi görmeyi bekliyoruz. Bu “AI cihazları”, organizasyonların akıllı sistemleri dağıtmalarını, ancak verilerini kontrolünden çıkarmadan sağlayabilir.

Analystler, verilerini etkili bir şekilde birleştiren ve yöneten organizasyonların, AI projelerinden daha hızlı benimsenme ve daha yüksek ROI göreceğini öngörüyor. Recent bir veri hazırlığı raporuna göre, bu yetenek, sürekli olarak inovasyon yapan şirketleri, erken pilotlardan sonra duran şirketlerden ayırıyor. Fark souvent, AI sistemlerinin tutarlı, iyi yapılandırılmış bilgiye dayanıp dayanmadığına bağlı oluyor.

Alt Çizgi

Veri kalitesi, model tasarımındaki đột phámlara kıyasla heyecan verici görünmeyebilir, ancak AI’nin başarılı olup olmadığına karar veren sessiz bir güçtür. Temiz, güncel ve tutarlı verilere sahip olmadan, en akıllı sistemler bile tökezleyebilir. Onlarla birlikte, даже mütevazi AI projeleri de kalıcı değerler yaratabilir.

Her AI’ye yatırım yapan liderin basit bir soru sorması gerekir: Kararlarımızı yönlendiren verilere güveniyor muyuz? Gördüğümüz şey, “evet” diyebilen şirketlerin, AI yarışında zaten lider olan şirketler olduğu.

Oren Eini, RavenDB'in Kurucusu ve CEO'sudur, dünya çapındaki geliştiriciler ve işletmeler tarafından güvenilen çok modelli NoSQL belge veritabanı. RavenDB veritabanının büyümesi ve genişlemesinin arkasındaki itici güç olmasının yanı sıra Oren, tutkulu bir blogger ve dünya çapındaki endüstri etkinlerinde düzenli olarak konuşmacıdır.