Лідери думок
Перегляд відкритого джерела у добу генеративного ІІ

Модель відкритого джерела – етика розробки програмного забезпечення, при якій вихідний код робиться вільно доступним для публічного поширення або модифікації – давно є каталізатором інновацій. Ідеал з’явився у 1983 році, коли Річард Столлман, розробник програмного забезпечення, розчарувався у чорній скриньці свого закритого джерела друку на перерві.
Його бачення спровокувало рух вільного програмного забезпечення, проклавши шлях для екосистеми відкритого джерела, яка живить більшу частину сучасного Інтернету та інновацій програмного забезпечення.
Але це було понад 40 років тому.
Сьогодні генеративний ІІ з його унікальними технічними та етичними викликами змінює значення “відкритості”, вимагаючи, щоб ми переглянули та переосмислили парадигму відкритого джерела – не для того, щоб відмовитися від неї, а щоб адаптувати її.
ІІ та свободи відкритого джерела
Чотири фундаментальні свободи програмного забезпечення відкритого джерела – можливість виконувати, вивчати, модифікувати та поширювати будь-який код програмного забезпечення – суперечать природі генеративного ІІ кількома способами:
- Виконання: Моделі ІІ часто вимагають дуже високих інфраструктурних та обчислювальних витрат, які обмежують доступ через обмеження ресурсів.
- Вивчення та модифікація: Моделі ІІ надзвичайно складні, тому розуміння та зміна їх без доступу до коду та даних, які інформують його, є серйозним викликом.
- Поширення: Багато моделей ІІ обмежують поширення за своїм проектом, особливо ті, які мають навчені ваги та власні набори даних, що належать постачальнику платформи.
Ерозія цих основних принципів не є результатом злого наміру, а радше величезної складності та вартості сучасних систем ІІ. Насправді фінансові вимоги навчання моделей ІІ останнього покоління драматично зросли за останні роки – GPT-4 від OpenAI, як повідомляється, мав витрати на навчання до 78 мільйонів доларів, окрім зарплат працівників, з загальними витратами більше 100 мільйонів доларів.
Складність “відкритого джерела” ІІ
Справді відкрита модель ІІ вимагала б повної прозорості коду джерела висновку, коду джерела навчання, ваг моделі та навчальних даних. Однак багато моделей, позначених як “відкриті”, будуть випускати лише код висновку або часткові ваги, тоді як інші пропонують обмежену ліцензію або обмежують комерційне використання зовсім.
Ця безстороння відкритість створює ілюзію принципів відкритого джерела, хоча на практиці це не так.
Розгляньте, що аналіз Ініціативи відкритого джерела (OSI) показав, що кілька популярних великих мовних моделей що називаються відкритими джерелами – включаючи Llama2 і Llama 3.x (розроблені Meta), Grok (X), Phi-2 (Microsoft) і Mixtral (Mistral AI) – є структурно не сумісними з принципами відкритого джерела.
Виклики сталості та стимуляції
Більшість програмного забезпечення відкритого джерела була створена на основі добровільних або грантових зусиль, а не обчислювально-інтенсивних, високовитратних інфраструктур. Моделі ІІ, з іншого боку, дорого коштують для навчання та підтримки, а витрати, як очікується, зростатимуть. Генеральний директор Anthropic, Даріо Амодей, передбачає, що це може в кінцевому підсумку коштувати $100 мільярдів для навчання передової моделі.
Без сталої моделі фінансування або структури стимуляції розробники стикаються з вибором між обмеженням доступу через закрите джерело або некомерційні ліцензії чи ризиком фінансового краху.
Помилкові уявлення про “відкриті ваги” та ліцензування
Доступність моделей ІІ стала все більш заплутаною, оскільки багато платформ позиціонують себе як “відкриті”, одночасно вводячи обмеження, які фундаментально суперечать справжнім принципам відкритого джерела. Цей “фокус” проявляється кількома способами:
- Моделі, позначені як “відкриті ваги”, можуть забороняти комерційне використання зовсім, зберігаючи їх більше як академічні курйози, ніж практичні бізнес-інструменти для громадськості, щоб досліджувати та розвивати.
- Деякі постачальники пропонують доступ до попередньо навчених моделей, але ревно охороняють свої навчальні набори даних та методи, роблячи неможливим відтворення або перевірку їхніх висновків суттєво.
- Багато платформ вводять обмеження на поширення, які запобігають розробникам будувати на моделях або покращувати їх для своїх спільнот, навіть якщо вони можуть повністю “доступитися” до коду.
У цих випадках “відкрито для дослідження” – це просто подвійність мови для “закрито для бізнесу”. Результатом є нечесна форма блокування постачальника, коли організації інвестують час і ресурси в платформи, які здаються відкрито доступними, лише щоб виявити критичні обмеження при спробі масштабувати або комерціалізувати застосування.
Результатуюча плутанина не тільки розчаровує розробників. Вона активно підkopує довіру до екосистеми ІІ. Вона створює нереальні очікування серед зацікавлених сторін, які розумно припускають, що “відкритий” ІІ порівнюється з громадами програмного забезпечення відкритого джерела, де прозорість, права на модифікацію та комерційна свобода дотримуються.
Юридична затримка
Швидке просування Генеративного ІІ вже обганяє розвиток відповідних юридичних рамок, створюючи складну мережу інтелектуальних викликів власності, які посилюють попередні проблеми.
Перший великий юридичний поле битви центрується навколо використання навчальних даних. Глибокі моделі навчання джерела великих наборів даних з Інтернету, таких як публічно доступні зображення та текст веб-сторінок. Це масивне збирання даних спровокувало жаркі дебати про права інтелектуальної власності. Технологічні компанії стверджують, що їхні системи ІІ вивчають і вчаться з авторських матеріалів, щоб створити новий, трансформаційний контент. Власники авторських прав, однак, стверджують, що ці компанії ІІ незаконно копіюють їхні твори, генеруючи конкуруючий контент, який загрожує їхньому засобу існування.
Власність ІІ-генерованих похідних робіт представляє ще одну юридичну неоднозначність. Ніхто не зовсім впевнений, як класифікувати ІІ-генерований контент, окрім Управління з питань авторських прав США, яке заявляє, що “якщо ІІ повністю генерує контент, він не може бути захищений авторським правом”.
Юридична невизначеність щодо Генеративного ІІ – особливо щодо порушення авторських прав, власності ІІ-генерованих робіт та незаконного контенту в навчальних даних – стає ще більш складною, оскільки фундаментальні моделі ІІ виходять як інструменти геополітичної важливості: Нації, які беруть участь у розробці суперірних можливостей ІІ, можуть бути менш схильні обмежувати доступ до даних, ставлячи країни зі суворішими захистом інтелектуальної власності у конкурентну невигоду.
Що відкрите джерело повинно стати в добу ІІ
Потяг Генеративного ІІ вже відправився і не показує жодних ознак сповільнення. Ми сподіваємося побудувати майбутнє, де ІІ сприяє, а не гальмує інновації. У цьому випадку лідери технологій потребують рамок, які забезпечують безпечне та прозоре комерційне використання, сприяють відповідальному інноваціям, займаються питаннями власності даних та ліцензування та розрізняють між “відкритим” та “безкоштовним”.
Поява концепції Відкритої комерційної ліцензії джерела може пропонувати шлях вперед, пропонуючи безкоштовний доступ для некомерційного використання, ліцензований доступ для комерційного використання та визнання та повагу до походження та власності даних.
Щоб адаптуватися до цієї нової реальності, спільнота відкритого джерела повинна розробити моделі ліцензування ІІ, сформувати державно-приватні партнерства для фінансування цих моделей та встановити довірені стандарти прозорості, безпеки та етики.
Відкрите джерело змінило світ один раз. Генеративний ІІ змінює його знову. Щоб зберегти дух відкритості, ми повинні еволюціонувати букву її закону, визнаючи унікальні вимоги ІІ та займаючись викликами безпосередньо, щоб створити інклюзивну та сталую екосистему.












