Düşünce Liderleri
Çin'in Yapay Zeka Serabı: "Açık Kaynak" En Önemli Şeyleri Nasıl Gizler?

Google, Microsoft ve Meta gibi büyük teknoloji oyuncularının yapay zeka pazarına hakim olmak için yarıştığı bir ortamda, Çin'in High Flyer, Baidu, Moonshot ve Alibaba, yapay zekaya dayalı yeni ürünlerini piyasaya sürerek manşetlere çıktı. Derin Arama, ERNIE 4.5, Kimi K2, ve Qwen3 Büyük dil modelleri sırasıyla açık kaynaklı olarak. Korunaklı, tescilli GenAI modellerinin yayınlanmasından bu yana yaşanan bu değişim, Çin'in yapay zeka endüstrisinin yapay zeka gelişimini demokratikleştirmek ve inovasyonu teşvik etmek için açık kaynaklı yazılımların gücünü benimsediğinin bir işareti olarak algılandı.
Ancak, ürünlerini açık kaynaklı olarak tanıtan ve hatta şirket adlarına ekleyen birçok oyuncu gibi, High Flyer, Baidu ve Moonshot da modellerinin merkezinde yer alan veri kümeleri gibi kritik parçaları paylaşmadı. Bu büyük modeller, geliştiricilerin güvendiği emtialar haline gelmeye çalışırken, test edilebilen, araştırılabilen ve üzerinde yineleme yapılabilen gerçek bir açık kaynak kodunun şeffaflığı, hepimizin güvenebileceği tarafsız, etik ve faydalı bir teknoloji yaratmak için kritik öneme sahiptir. Tüm bu "açık kaynaklı" modeller aslında "açık ağırlık"tır; yani indirilebilir ve kullanılabilirler, ancak veriler olmadan anlamlı bir şekilde incelenemezler.
ABD'li oyuncuların istediği gibi AI'yi aç ve Meta Açık kaynak kodlu yazılımlardan uzaklaşıyor gibi görünse de, Baidu'nun ücretsiz olarak sunulan ERNIE 4.5 modellerinden yararlanmaya yönelik açık daveti, daha küçük ve güçlü uygulamalar geliştirmek isteyen geliştiricilerle inovasyonu ve iş birliğini teşvik edebilir. Aynı zamanda, Çin'in Google'ına benzeyen şirket, benimsenmeyi teşvik ederek ve modellerini gelişen yapay zeka ekosistemine yerleştirerek rekabette bir adım öne geçmiştir.
Aynı şey DeepSeek, düşük fiyatlı Kimi K2 ve güncellenmiş Qwen3 için de söylenebilir; bu model, Claude Opus 4 ve GPT-4o-0327 gibi kapalı modellere meydan okuyan kıyaslama değerlerine sahip.
Bu yapay zeka oyuncuları, tercih edilen emtia modeli olma yarışında kendilerini iyi bir konuma getirdiler ve Qwen3'ün son yenilikçi güncellemesi bile açık kaynak topluluğunun geri bildirimlerinden ilham aldı.
Ancak, büyük yapay zeka modellerini açık kaynaklı olarak tanıtan birçok kişi gibi, Çin yapay zeka topluluğu da yapay zeka sistemlerinin verilerini veya diğer kritik parçalarını paylaşmıyor. Bunun yerine, küresel geliştiricilerden, gerçekten anlayamadıkları veya inceleyemedikleri modellere körü körüne güvenmelerini istiyorlar.
Açık kaynaklı emtia AI modelleriyle geleceğe sahip çıkmak
iPhone 2007'de piyasaya çıktığında, bazıları Mac'in iOS ile akıllı telefon oyununa hükmedeceğini varsayıyordu, ancak Açık kaynaklı katılım, yeni kurulan şirketler için olmazsa olmazdırAynı zamanda dünya çapında girişimciliği ve ekonomik büyümeyi de teşvik etti ve 2005 yılında Google tarafından satın alınan bir girişim olan Android de bu yolu izleyerek zafere ulaştı.
Android, görüntülenebilen, değiştirilebilen, benimsenebilen ve paylaşılabilen açık kaynaklı yazılımlar yayınlayarak akademisyenleri, geliştiricileri ve hatta rakipleri yazılım üzerinde iş birliği yapmaya davet etti. Bu, inovasyon sürecini hızlandırdı, rekabet alanını demokratikleştirdi ve nihayetinde fiyatları düşürdü. Android, ilk iPhone'dan bir yıl sonra piyasaya çıktı ve bu yılın başında, küresel pazarın yüzde 71.88'ine sahipken, iOS'un payı yüzde 27.65 oldu.
Bir gecede gerçekleşmiş gibi görünen teknolojik bir devrimle akıllı telefonlar her yerde bulunur hale geldi ve yazılım, donanım ve kullanıcı arayüzündeki gelişmeler devam etse de, sektör akıllı telefonların çalışma şeklini kökten değiştirmeye çalışmanın çok ötesine geçti. Cep telefonları artık bir meta haline geldiğine göre, günümüzdeki yenilik, üzerlerinde çalışan uygulamalarda yatıyor ve akıllı telefon sağlayıcılarının rekabette öne çıkabilmeleri için geliştiricileri de davet eden bir ekosistemi sürdürmeleri gerekiyor.
ChatGPT'nin piyasaya sürülmesinden henüz üç yıl sonra, yapay zeka sektörü de benzer bir uçurumun eşiğinde. Küresel yapay zeka sektöründeki her oyuncu, modellerinin bir sonraki Android hatta iOS olmasını hedefliyor. Çinli yenilikçiler ise DeepSeek, ERNIE 4.5 ve Kimi K2 modelleriyle açık kaynaklı hale gelerek, gelişmekte olan bir ekosistemde hak iddia etmeyi hedefliyor.
Bu durum onların lehine işleyebilir, ancak yalnızca yeniliğin değil, güvenebileceğimiz yeniliğin de gelişmesi için gerekli olan açık kaynak kodunun gerçek şeffaflığını desteklemez.
Veri, çoğu açık kaynaklı yapay zekada eksik olan parçadır
Yapay zeka modellerinin oluşturulması ve paylaşılması geleneksel yazılımlara göre çok daha karmaşık olduğundan, tamamen açık kaynaklı yapay zekaya olan talep hiç de küçümsenecek bir şey değil. Yapay zeka sistemleri, basit bir kaynak kodu yerine, şunlardan oluşur: yedi bileşen—kaynak kodu, model parametreleri, veri seti, hiperparametreler, eğitim kaynak kodu, rastgele sayı üretimi ve yazılım çerçeveleri dahil.
Bir modelin istenen sonuçları vermesi için her bir parçanın uyum içinde çalışması gerekir; bu da geliştiricilerin bir sistemi paylaşmak, değiştirmek, benimsemek ve neler olduğunu anlamak için tam görünürlüğe ihtiyaç duyduğu anlamına gelir. Ancak, bilimsel yöntemin temeli yeniden üretilebilirlik olduğundan, yapay zeka endüstrisinin... alışkanlık Bulmacanın birkaç parçasına erişim sağlayan ücretsiz veya düşük fiyatlı sürümleri ifade etmek için açık kaynak teriminin kullanılması.
Örneğin Baidu, on adet ERNIE 4.5 modelini ücretsiz olarak kullanıma sundu. Şirket, model ve parametreleri paylaşmanın yanı sıra, ERNIEKit ve FastDeploy dağıtım araç setlerini de açık kaynaklı hale getirdi. Bu araçlar, geliştiricilerin endüstriyel düzeyde yetenekler, kaynak açısından verimli eğitim ve çıkarım iş akışları ve çoklu donanım uyumluluğu sağlayarak güçlü yapay zeka uygulamaları geliştirmelerine olanak tanıyor.
Başka bir deyişle, Baidu geliştiricilere yenilikleri daha hızlı hayata geçirmelerini sağlayacak heyecan verici araçlar sağladı ve bu araçların da onları ERNIE 4.5'i rakiplerine göre tercih etmeye teşvik edeceğini umuyorlar.
Ancak ERNIE 4.5'i kullanan geliştiricilerden, Baidu'nun modellerini bilgilendiren ve öğreten veri kümeleri de dahil olmak üzere birçok şeyi gizli tutması nedeniyle modele körü körüne güvenmeleri isteniyor.
Şeffaf açık kaynaklı yapay zeka modellerinin gücü
Yapay zeka bulmacasının her bir parçası bir modelin çalışması için kritik öneme sahip olsa da, Yapay zeka projelerinin yüzde 80'i başarısız oluyor ve sorunun merkezinde veri varYanlış, eksik ve önyargılı veri kümeleri, öngörülebilir veya istenildiği gibi davranmayan modellere yol açar.
The yakın zamanda yayınlanan ölümcül 2023 Tesla Tam Otonom Sürüş (FSD) kaza videosuÖrneğin, bir veri seti ve modelin yetersiz kalması durumunda neler olabileceğine dair en kötü senaryoyu ortaya koydu. Tesla Model Y parlak, batan güneşe doğru hızla ilerlerken, kısmen otomatik sistem kameralarının gördüklerini veya görmediklerini anlayamıyor veya uygun şekilde tepki veremiyor. İnsanların kullandığı arabalar yavaşlayıp kenara çekilirken, FSD'nin şaşkınlığı bir kadının ölümüne yol açtı.
Bu yıkıcı başarısızlık, eksik görsel verilerin yanı sıra bu tür kör noktaları hesaba katan bir güvenlik mekanizmasının eksikliğini de yansıtıyordu. Geliştiriciler verilerine erişemediğinde, verilerin modelle nasıl etkileşime girdiğini göremezler; bu da bu tür hataları ortaya çıkarıp sağlam bir performans için yineleme yapamayacakları anlamına gelir.
Daha da endişe verici olanı, modeli besleyen veriler olmadan, körü körüne ona güvenmek zorunda kalmalarıdır.
Ancak veri kümeleri açık kaynaklı olduğunda, yapay zeka topluluğu, ortaya çıkardığı verilerle sorunlu sorunları ortadan kaldıracağını kanıtladı. LAION 1,000B'de doğrulanmış Çocuk Cinsel İstismarı Materyali içeren 5'den fazla URLYapay zeka metinden görüntüye dönüştürme modelleri için kullanılan veri kümesi, Stable Diffusion ve Midjourney gibi uygulamaların oluşturulmasında temel teşkil ettiğinden, kullanıcılar yasadışı fotogerçekçi görüntüler üretmeye başlasaydı, yapay zeka sektörü için yıkıcı sonuçlar doğururdu. Ancak bu veri kümesinin açık yapısı, topluluğun tehlikeli içeriği ortaya çıkarmasına ve bir çözüm bulunmasına olanak sağladı. Bağlantı Görevlisi B.
Ayrıca, ilk veri setinin büyük bir kısmı, ChatGPT ve LLAMA modelleri için de kullanılan devasa Ortak Tarama tarafından gerçekleştirilen web kazıma işleminden yararlanıyordu. Yapay zeka tarayıcıları, metin yazarlığı, gizlilik ve önyargılı ve ırkçı etiketleme konusunda endişelerini dile getirmeye devam ediyorAncak, AI topluluğundaki geliştiriciler Common Crawl'ın büyüyen açık kaynaklı veri kümesinin parçalarını daha güvenli kullanım için temizlemenin yolları üzerinde çalışılıyor.
Geliştiriciler yalnızca güçlü yapay zeka değil, aynı zamanda güvenebileceğimiz yapay zekalar oluşturmayı hedefledikçe, hem kullanıcılar hem de sektör, gerçek açık kaynak kodlu çözümlerin şeffaflığı ve iş birliğiyle korunmaktadır.
Açık kaynak yolunu benimsemek
Birçok kişi bu gelişen teknolojiye karşı hâlâ temkinli olsa da, büyük yapay zeka emtia modellerinin iOS veya Android'i olma yarışı devam ediyor. Küresel yapay zeka topluluğu geleceğin standardı haline gelecek şeyi tam anlamıyla inşa ederken ve yapay zeka sistemleri halihazırda arabaları kullanıyor ve tıbbi değerlendirmeler sunuyorken, tarafsız, güvenilir ve emniyetli bir yapay zeka oluşturarak güven oluşturmak hiç bu kadar kritik olmamıştı.
Çin'in yapay zeka topluluğu kendini açık inovasyonun savunucusu olarak konumlandırmaya çalışırken, güvenli yapay zekaya giden yol, onlarca yıllık yazılım inovasyonuyla kanıtlanmış gerçek açık kaynak kodlu sistemlerin şeffaflığında yatıyor. Bu terimi, veri gibi kritik parçaları paylaşmayan sistemlere uygulamak, geliştiricilerin araştırma, çoğaltma ve yineleme yapmasına olanak tanımıyor. DeepSeek, ERNIE 4.5, Kimi K2 ve Qwen3 gibi kolayca bulunabilen modellerin cazibesi inkar edilemez olsa da, bu modellerden yararlanan geliştiriciler, iş birliğini ve inovasyonu teşvik eden şeffaflığı kolaylık için feda ediyorlar.
Yapay zeka topluluğunun şu iki seçeneği var: Gerçek açık kaynak yoluyla radikal şeffaflığı benimsemek ya da yarının kritik sistemlerini bugünün kara kutuları üzerine inşa etme riskini almak.