Лідери думок
Шаблон нового GPAI Європейської комісії – що це означає для навчання ІІ?

У липні Європейська комісія (ЄК) оприлюднила новий загального призначення штучного інтелекту (GPAI) шаблон. Це означає, що постачальники ІІ повинні розкрити вміст, введений у моделі для її навчання. Це відбулося після місяців і місяців заголовків щодо творців алегуючи, що вміст був використаний без згоди для навчання ІІ.
З цим новим шаблоном ЄС зробив свою позицію ясною: прозорість тепер є непереговорним. “Чорна скринька” навчання, де щось створюється без розкриття його внутрішньої роботи, не буде варіантом для розробників ІІ. Це позначає значний зсув, оскільки робота в Європі тепер буде вимагати повної видимості вводу моделі та походження навчальних даних, що змушує переоцінити збір і використання даних.
Багато людей вказали на різку відмінність між цим і недавно оприлюдненим планом дій США щодо ІІ, який сильно акцентує на дерегуляції. Як і з будь-яким новим законом або регламентом, бізнес тепер повинен взяти до уваги і оцінити, яким чином шаблон GPAI вплине на операції.
Якщо вони працюють у різних регіонах, вони будуть робити те саме з планом дій США щодо ІІ, що ще більше ускладнює ситуацію. Через складний характер цих регламентів і те, що регулювання розвитку ІІ в цьому спосіб є невідкритою територією, результати розробників, ймовірно, будуть сильно відрізнятися.
Детальний аналіз шаблону загального призначення штучного інтелекту
У липні цього року Європейська комісія оприлюднила обов’язковий шаблон для постачальників GPAI, щоб вони могли опублікувати публічний підсумок даних, використаних для навчання їхніх моделей. Як частина Закону ЄС про ІІ, постачальники повинні розкрити категорії даних, такі як публічно доступні набори даних, приватні ліцензовані дані, веб-контент, дані користувачів і синтетичні дані. Метою є дозволити власникам авторських прав, користувачам і розробникам нижчого рівня здійснювати свої юридичні права згідно з законодавством ЄС.
GPT навчаються на великих кількостях даних; однак на сучасному ринку існує обмежена інформація щодо походження цих даних. Публічний підсумок, який цей шаблон передбачає, надасть всебічний огляд даних, використаних для навчання моделі, перелічить основні колекції даних і пояснить інші джерела, використані.
Порівняння та контраст плану дій США щодо ІІ
На відміну від цього, США твердо переконані, що вони виграють гонку ІІ і підтримують своє конкурентне优势 над Китаєм, оскільки адміністрація Трампа оголосила свій план дій щодо ІІ на початку літа. Цей новий каркас ІІ спрямований на прискорення будівництва енергозатратних центрів даних, які живлять системи ІІ, шляхом полегшення екологічних регуляцій. У той же час він спрямований на збільшення глобального експорту американських технологій ІІ. Охарактеризований 90 рекомендаціями, план відображає зростаючі зусилля США залишатися попереду своїх глобальних конкурентів.
План побудований навколо трьох основних стовпів – прискорення інновацій, будівництво інфраструктури ІІ Америки та сприяння лідерству в міжнародній дипломатії та безпеці ІІ.
Як частина цього, ключовий висновок з плану підкреслив “відкритий” поштовх США до палива інновацій та доступності. Аналогічно, план підкреслює, як уряд США буде “лідувати прикладом” щодо зростання ІІ – через навчання, обмін талантами та розширення прийняття по галузях.
З цим планом США спрямовані на спрощення всіх своїх поточних технологічних регуляцій, особливо екологічних, щоб забезпечити, що законодавство не сповільнює зростання, а також заохочують ширше міжнародне розповсюдження американського програмного забезпечення та апаратного забезпечення ІІ. Цей “антирегуляторний” підхід позначає явний зсув від попередніх каркасів, центрованих на етиці, прозорості та відповідальному інноваційному розвитку – натомість рухається до більш агресивного “інноваційного першого” плану дій.
Відсутня частина
Цінно зробити крок назад на цій стадії і розглянути, чи ці акти, хоча й різні, можуть страждати від тих самих недоліків, які спричинять, що розробники бачать відсутність цінності у дотриманні їх. Підходи ЄС і США залишають критичну прогалину навколо інтелектуальної власності в наборах даних для навчання ІІ. Закон ЄС про ІІ вимагає підсумків навчальних даних і політики дотримання авторських прав, але він не встановлює масштабований каркас для ідентифікації або ліцензування захищених творів.
У США немає конкретних правил – залишаючи компанії ІІ орієнтуватися в еволюючому юридичному каркасі, сформованому судовими рішеннями та триваючими спорами з власниками прав. За межами юридичного тексту, те, що відсутнє, – це практичний аспект; жоден з підходів не встановлює дієві, галузеві методи для виявлення захищеного вмісту у великих масштабах, верифікації законного використання чи спрощення ліцензування. До тих пір, поки такі рішення не будуть визначені, невизначеність щодо авторських прав у наборах даних для навчання ІІ залишається значною проблемою для галузі.
Прихована вартість бізнесу, який пропускає слідування ІІ
Незважаючи на деякі недоліки цих регуляцій, буде припущено, що вони спричинять, що розробники ІІ будуть сильно зосереджені на тому, як залишитися на плаву з юридичної точки зору – але це не завжди так. Насправді, справжній розрив у сфері ІІ зараз не між регуляціями ЄС і США, а між компаніями, які інвестують у слідування сьогодні, і тими, хто грає в азартні ігри, що їм не доведеться. Це повторення того, що ми бачили роки тому з впровадженням Загального регламенту захисту даних (GDPR) – компанії, які будували приватність з самого початку, не тільки уникнули штрафів, але й здобули довіру споживачів і легше отримали доступ до інших ринків, які пізніше відображали стандарти GDPR.
Той самий патерн, можливо, з’являється з ІІ. Слідування навчальних даних і рішень моделі, ймовірно, стане глобальним стандартом, а компанії, які затримують, будуть змушені переробити свої системи в майбутньому. Повернення, щоб додати документацію, слідування походженню, функції аудиту до існуючої системи, значно дорожче і складніше, ніж будівництво їх з самого початку, відводячи увагу від більш орієнтованих на ROI побудов, які компанія хоче завершити.
Іншими словами, слідування та прозорість не є необов’язковими додатками; вони повинні бути вбудовані в системи ІІ з дня першого. Бізнес, який ставиться до них як до післядуми, ризикує загальмувати інновації, зіткнутися з регуляторним наступом і програти гонку назавжди.
Етичний ІІ потребує глобальної єдності
З макроперспективи ці поляризовані підходи створюють реальну проблему для глобальних бізнесів. Компанії в легших ринках, таких як США, можуть розширюватися швидше в короткій перспективі, але коли вони вирішують вступити до ЄС, вони стикаються з бар’єром дотримання: правила слідування та документації Закону про ІІ вимагають можливостей, яких вони ніколи не будували.
Перебудова слідування походженню, документації та функцій аудиту в існуючу систему є дорогою, повільною та руйнівною, особливо тому, що слідування є однією з найбільш ресурсоємних частин дотримання. Це той самий патерн, який ми бачили з GDPR, де пізні прибульці до приватності зазнали дорогих переробок і затримки доступу до ринку, тоді як ранні прибульці здобули тривалу перевагу.












