Düşünce Liderleri
Üretken Yapay Zeka Çağında Açık Kaynağı Yeniden Düşünmek

Açık kaynak modeli - kaynak kodunun kamuya açık yeniden dağıtım veya değişiklik için ücretsiz olarak sunulduğu bir yazılım geliştirme anlayışı - uzun zamandır inovasyonun katalizörü olmuştur. Bu ideal, 1983 yılında bir yazılım geliştiricisi olan Richard Stallman'ın kapalı kaynaklı yazıcısının bozulan kara kutu yapısından bıkmasıyla ortaya çıkmıştır.
Vizyonu, özgür yazılım hareketini ateşledi ve günümüzün internet ve yazılım inovasyonunun büyük bir kısmını destekleyen açık kaynak ekosisteminin önünü açtı.
Ama bu 40 yıldan fazla zaman önceydi.
Günümüzde, kendine özgü teknik ve etik zorlukları olan Üretken Yapay Zeka, "açıklık" kavramının anlamını yeniden şekillendiriyor ve açık kaynak paradigmasını yeniden ele almamızı ve yeniden düşünmemizi talep ediyor; onu terk etmemizi değil, uyarlamamızı istiyor.
Yapay Zeka ve Açık Kaynak Özgürlükleri
Açık kaynaklı yazılımın dört temel özgürlüğü – çalıştırın, inceleyin, değiştirin ve yeniden dağıtın Herhangi bir yazılım kodu – üretken yapay zekanın doğasıyla birkaç yönden çelişmektedir:
- Koşmak: Yapay zeka modelleri genellikle çok yüksek altyapı ve hesaplama maliyetleri gerektirir; bu da sınır erişim Kaynak kısıtlamaları nedeniyle.
- Çalışın ve değiştirin: Yapay zeka modelleri inanılmaz derecede karmaşıktır, bu nedenle onları anlamak ve değiştirmek Hem koda hem de onu bilgilendiren verilere erişim sağlanamaması önemli bir zorluktur.
- yeniden dağıtma: Birçok AI modeli yeniden dağıtımı kısıtlamak tasarım gereği, özellikle eğitilmiş ağırlıklara ve platform sağlayıcısına ait tescilli veri kümelerine sahip olanlar.
Bu temel ilkelerin aşınması kötü niyetten değil, modern yapay zeka sistemlerinin karmaşıklığından ve maliyetinden kaynaklanmaktadır. Nitekim, son teknoloji yapay zeka modellerini eğitmenin finansal gereksinimleri son yıllarda önemli ölçüde artmıştır; OpenAI'nin GPT-4 modelinin eğitim maliyetlerine katlandığı bildirilmektedir. 78 milyon dolara kadar, personel maaşları hariçtoplam harcamalarla aşırı $ 100 milyon.
"Açık Kaynaklı" Yapay Zekanın Karmaşıklığı
Gerçekten açık bir yapay zeka modeli, çıkarım kaynak kodunun, eğitim kaynak kodunun, model ağırlıklarının ve eğitim verilerinin tam şeffaflığını gerektirir. Ancak, "açık" olarak etiketlenen birçok model yalnızca çıkarım kodunu veya kısmi ağırlıkları yayınlarken, diğerleri sınırlı lisanslama sunar veya ticari kullanımı tamamen kısıtlar.
Bu tarafsız açıklık, açık kaynak ilkeleri yanılsaması yaratırken, pratikte yetersiz kalmaktadır.
Açık Kaynak Girişimi (OSI) tarafından yapılan bir analizin, birkaç popüler büyük dil modelinin açık kaynaklı olduğunu iddia eden – Llama2 ve Llama 3.x (Meta tarafından geliştirilmiştir), Grok (X), Phi-2 (Microsoft) ve Mixtral (Mistral AI) dahil olmak üzere – açık kaynak ilkeleriyle yapısal olarak uyumsuzdur.
Sürdürülebilirlik ve Teşvik Zorlukları
Açık kaynaklı yazılımların çoğu, yoğun işlem gerektiren ve yüksek maliyetli altyapılar yerine gönüllülük veya hibe destekli çalışmalarla oluşturulmuştur. Öte yandan, yapay zeka modellerinin eğitimi ve bakımı pahalıdır ve maliyetlerin artması beklenmektedir. Anthropic CEO'su Dario Amodei, bunun sonunda şu kadara mal olabileceğini öngörüyor: $ 100 milyar son teknoloji bir model yetiştirmek.
Sürdürülebilir bir finansman modeli veya teşvik yapısı olmadan, geliştiriciler kapalı kaynaklı veya ticari olmayan lisanslar aracılığıyla erişimi kısıtlamak veya finansal çöküş riskiyle karşı karşıya kalmak arasında bir seçimle karşı karşıya kalıyor.
"Açık Ağırlıklar" ve Lisanslama Hakkındaki Yanlış Anlamalar
Yapay zeka modeli erişilebilirliği giderek daha karmaşık hale geldi; birçok platform kendilerini "açık" olarak pazarlarken, gerçek açık kaynak ilkeleriyle temelden çelişen kısıtlamalar getiriyor. Bu "el çabukluğu" çeşitli şekillerde ortaya çıkıyor:
- "Açık ağırlık" olarak etiketlenen modeller ticari kullanımı tamamen yasaklayabilir ve bunları halkın keşfedip geliştirebileceği pratik iş araçlarından ziyade akademik meraklar olarak tutabilir.
- Bazı sağlayıcılar önceden eğitilmiş modellere erişim imkanı sunar ancak eğitim veri kümelerini ve metodolojilerini büyük bir özenle korurlar ve bu da bulgularının anlamlı bir şekilde yeniden üretilmesini veya doğrulanmasını imkansız hale getirir.
- Birçok platform, geliştiricilerin kodlara tam olarak "erişebilseler" bile, toplulukları için modelleri geliştirmelerini veya geliştirmelerini engelleyen yeniden dağıtım kısıtlamaları getirir.
Bu durumlarda, "araştırmaya açık" ifadesi, "işe kapalı" ifadesinin ikiyüzlü bir ifadesidir. Sonuç, kuruluşların açıkça erişilebilir görünen platformlara zaman ve kaynak yatırdığı, ancak uygulamaları ölçeklendirmeye veya ticarileştirmeye çalıştıklarında kritik sınırlamalarla karşılaştığı, samimiyetsiz bir tedarikçi bağımlılığı biçimidir.
Ortaya çıkan kafa karışıklığı yalnızca geliştiricileri hayal kırıklığına uğratmakla kalmıyor, aynı zamanda yapay zeka ekosistemine olan güveni de ciddi şekilde zedeliyor. "Açık" yapay zekanın, şeffaflığın, değişiklik haklarının ve ticari özgürlüğün korunduğu açık kaynaklı yazılım topluluklarıyla karşılaştırılabilir olduğunu makul bir şekilde varsayan paydaşlar arasında gerçekçi olmayan beklentiler yaratıyor.
Yasal Gecikme
GenAI'nın hızlı ilerlemesi, halihazırda uygun yasal çerçevelerin geliştirilmesini geride bırakarak, önceden var olan endişeleri daha da artıran karmaşık bir fikri mülkiyet zorlukları ağı yaratıyor.
İlk büyük hukuki mücadele alanı, eğitim verilerinin kullanımı üzerine kuruludur. Derin öğrenme modelleri, kamuya açık görseller ve web sayfalarının metinleri gibi büyük veri kümelerini internetten alır. Bu devasa veri toplama, fikri mülkiyet hakları konusunda şiddetli tartışmaları alevlendirmiştir. Teknoloji şirketleri, yapay zekâ sistemlerinin yeni ve dönüştürücü içerikler oluşturmak için telif hakkıyla korunan materyalleri inceleyip bunlardan öğrendiğini savunmaktadır. Ancak telif hakkı sahipleri, bu yapay zekâ şirketlerinin çalışmalarını yasadışı olarak kopyalayarak geçim kaynaklarını tehdit eden rakip içerikler ürettiğini iddia etmektedir.
Yapay zekâ tarafından üretilen türev eserlerin mülkiyeti, bir diğer hukuki belirsizliği temsil ediyor. Yapay zekâ tarafından üretilen içeriklerin nasıl sınıflandırılacağından emin olmayan ABD Telif Hakları Ofisi, "Eğer içerik tamamen yapay zekâ tarafından üretiliyorsa, telif hakkıyla korunamaz" diyor.
GenAI'yi çevreleyen yasal belirsizlik (özellikle telif hakkı ihlali, yapay zeka tarafından üretilen eserlerin mülkiyeti ve eğitim verilerindeki lisanssız içerikle ilgili olarak) temel yapay zeka modellerinin jeopolitik öneme sahip araçlar olarak ortaya çıkmasıyla daha da gerginleşiyor: Üstün yapay zeka yetenekleri geliştirmek için yarışan ülkeler, veri erişimini kısıtlamaya daha az meyilli olabilir ve bu da daha sıkı fikri mülkiyet korumalarına sahip ülkeleri rekabet açısından dezavantajlı duruma sokabilir.
Yapay Zeka Çağında Açık Kaynak Nasıl Olmalı?
GenAI treni çoktan istasyondan ayrıldı ve yavaşlama belirtisi göstermiyor. Yapay zekanın inovasyonu engellemek yerine teşvik ettiği bir gelecek inşa etmeyi umuyoruz. Bu durumda, teknoloji liderlerinin güvenli ve şeffaf ticari kullanım sağlayan, sorumlu inovasyonu teşvik eden, veri sahipliği ve lisanslamayı ele alan ve "açık" ile "ücretsiz" arasında ayrım yapan bir çerçeveye ihtiyacı var.
Ortaya çıkan bir kavram olan Açık Ticari Kaynak Lisansı, ticari olmayan kullanım için ücretsiz erişim, ticari kullanım için lisanslı erişim ve verilerin kökeninin ve mülkiyetinin kabul edilmesi ve bunlara saygı gösterilmesini önererek ileriye doğru bir yol sunabilir.
Bu yeni gerçeğe uyum sağlamak için açık kaynak topluluğunun yapay zekaya özgü açık lisanslama modelleri geliştirmesi, bu modelleri finanse etmek için kamu-özel sektör ortaklıkları oluşturması ve şeffaflık, güvenlik ve etik için güvenilir standartlar oluşturması gerekiyor.
Açık kaynak dünyayı bir kez değiştirdi. Üretken Yapay Zeka ise onu tekrar değiştiriyor. Açıklık ruhunu korumak için, kapsayıcı ve sürdürülebilir bir ekosistem yaratmak adına, yapay zekanın kendine özgü taleplerini kabul ederken zorlukları da doğrudan ele alarak, açık kaynak kodlu yazılımların kurallarını geliştirmeliyiz.