Фінансування
Protege зібрав 30 млн доларів серії А для розширення доступу до реальних даних для штучного інтелекту

Protege, платформа даних штучного інтелекту, яка зосереджена на розблокуванні довірчих реальних наборів даних для розробки штучного інтелекту, зібрала 30 млн доларів серії А, яку очолила Andreessen Horowitz. Новий фінансування розширює 25 млн доларів серії А оголошених у серпні 2025 року та збільшує загальне фінансування до 65 млн доларів з моменту заснування у 2024 році.
Повернувшись інвестори включають Footwork, CRV, Bloomberg Beta, Flex Capital та Shaper Capital, що відображає зростаючу впевненість інвесторів у підході Protege до однієї з найбільш постійних проблем у штучному інтелекті: доступ до високоякісних, не публічних даних.
Порушення зростаючих обмежень даних штучного інтелекту
Як моделі штучного інтелекту розвиваються, обмежувальним фактором все частіше стає не обчислення чи алгоритми, а дані. Публічні набори даних стають насиченими, тоді як багато з найбільш цінних джерел інформації – таких як медичні записи, медійні архіви, аудіодані та дані руху – залишаються фрагментованими, власними або важкими для доступу відповідально.
Protege знаходиться на перетині володарів даних та розробників штучного інтелекту, забезпечуючи ліцензований доступ до реальних наборів даних, одночасно забезпечуючи їх структуризацію, кураторство та оптимізацію для сучасних робочих процесів штучного інтелекту. Попит на цей тип даних швидко зростає у різних галузях, особливо коли системи штучного інтелекту переходять від експериментів до виробничих середовищ.
Модель ліцензування для реальних даних
Натомість ніж покладатися на скрапінг або неструктуроване збирання, Protege працює безпосередньо з довіреними постачальниками даних через ліцензійні угоди. Ці партнери внесли приватні та власні набори даних, які можуть включати деідентифіковані медичні записи, медичне зображення, аудіозаписи та медійний контент.
Protege застосовує технічну експертизу для очистки, кураторства та пакування цих даних, щоб вони могли бути використані ефективно для навчання та оцінки. Постачальники даних беруть участь через угоди про розподіл доходів, пов’язані з використанням, створюючи повторювану модель, яка вирівнює стимули навколо відповідального доступу та повторного використання даних.
Компанія працює з організаціями штучного інтелекту та установами по всьому світу, включаючи багато з найбільших технологічних компаній світу, підтримуючи розвиток наступних поколінь систем штучного інтелекту у 여러 доменах.
Досвідчені лідери та стратегічна підтримка
Protege очолює генеральний директор і співзасновник Боббі Семюелс, з Тревісом Мей – раніше генеральним директором Datavant і LiveRamp – як головою і співзасновником. Команда лідерів має глибокий досвід навігації даних у галузях, де приватність, відповідність та масштаб є критичними. У недавньому інтерв’ю з Unite.AI Семюелс обговорював, як його досвід у сфері управління даними та приватності сформував його бачення платформи, яка з’єднує володарів даних та розробників штучного інтелекту прозорим та етичним способом, підкреслюючи зростаючу важливість керованого доступу до даних у ширшій екосистемі штучного інтелекту. –
З точки зору інвесторів Andreessen Horowitz розглядає доступ до власних реальних даних як визначальну перевагу у наступній фазі штучного інтелекту. Коли архітектури моделей стають більш стандартизованими, відрізняються дані – з чітким походженням та етичним ліцензуванням – виходять як ключовий драйвер продуктивності та конкурентної захищеності.
Як Protege планує використовувати новий капітал
Розширення серії А підтримає розширення розробки продукту, зростання мережі партнерів з даними Protege у нових доменах та форматах, а також глибшу співпрацю з установами, які володіють цінними реальними даними. Компанія також планує масштабувати свою інфраструктуру та команду для задоволення зростаючого попиту від груп досліджень та розробки штучного інтелекту.
Ця увага відображає ширший промисловий зсув, де прогрес штучного інтелекту все частіше пов’язаний з якістю даних, походженням та актуальністю, а не лише з розміром моделі.
Вплив на майбутнє штучного інтелекту
Імпульс Protege вказує на структурну зміну у тому, як будуються системи штучного інтелекту. Коли легко доступні джерела даних вичерпуються, майбутні прориви, ймовірно, будуть походити від відповідальним розблокуванням приватних реальних даних, згенерованих під час повсякденної діяльності.
Платформи, такі як Protege, свідчать про майбутнє, де доступ до даних керується, компенсується та прозорим. Для розробників штучного інтелекту це може означати більш надійні та домен-специфічні моделі. Для володарів даних це створює сталий шлях для участі у розробці штучного інтелекту без втрати контролю.
З часом цей підхід може вплинути на те, як галузь – та регулятори – думають про володіння даними, повторне використання та створення цінності. Натомість ніж розглядати дані як щось, що потрібно витягнути, розвиток штучного інтелекту може все частіше залежати від мереж, заснованих на довірі, які балансують інновації з відповідальністю.












