Connect with us

Ерік ЛандAU, співзасновник та CEO Encord – Інтерв’ю Серія

Інтерв’ю

Ерік ЛандAU, співзасновник та CEO Encord – Інтерв’ю Серія

mm

Ерік ЛандAU є CEO та співзасновником Encord, активної платформи навчання для комп’ютерного зору. Ерік був провідним квантитативним дослідником на глобальному еквіті дельта-один столі, розмістивши тисячі моделей у виробництві. До Encord він провів майже десятиліття у високочастотній торгівлі в DRW. Він має ступінь магістра прикладної фізики в Гарвардському університеті, магістра електротехніки та бакалавра фізики в Стенфордському університеті.

У свій вільний час Ерік любить грати з ChatGPT та великими мовними моделями та виготовляти ремеслені коктейлі.

Що надихнуло вас співзасновувати Encord, і як ваш досвід у фізиці частинок та квантитативній фінансах сформував ваш підхід до вирішення “проблеми даних” у штучному інтелекті?

Я вперше почав думати про машинне навчання, працюючи у фізиці частинок та займаючись дуже великими наборами даних під час свого перебування в Стенфордському лінійному прискорювачі (SLAC). Я використовував програмне забезпечення, розроблене фізиками для фізиків, тобто було багато чого бажати щодо приємного користувальницького досвіду. За допомогою простіших інструментів я міг би виконувати аналіз значно швидше.

Пізніше, працюючи у квантитативній фінансах у DRW, я був відповідальним за створення тисяч моделей, які були розгорнуті у виробництві. Подібно до мого досвіду у фізиці, я виявив, що високоякісні дані були критично важливими для створення точних моделей, а керування складними, великомасштабними даними є складним. Ульрік мав подібний досвід візуалізації великих наборів зображень для комп’ютерного зору.

Коли я дізнався про його початкову ідею щодо Encord, я одразу ж погодився та зрозумів важливість. Разом з Ульріком ми побачили величезну можливість побудувати платформу для автоматизації та оптимізації процесу розробки даних штучного інтелекту, роблячи його простішим для команд отримувати найкращі дані у моделі та створювати надійні системи штучного інтелекту.

Чи можете ви роз’яснити бачення за Encord та як воно порівнюється з ранніми днями комп’ютерів або інтернету щодо потенціалу та викликів?

Бачення Encord полягає у тому, щоб бути фундаментальною платформою, на яку підприємства будуть покладатися для перетворення своїх даних у функціональні моделі штучного інтелекту. Ми є шаром між даними компанії та її штучним інтелектом.

У багатьох аспектах штучний інтелект дзеркально відображає попередні парадигматичні зрушення, такі як персональні комп’ютери та інтернет, оскільки він стане невід’ємною частиною робочих процесів для кожного індивіда, бізнесу, нації та галузі. На відміну від попередніх технологічних революцій, які були в основному обмежені законом Мура складного зростання обчислювальної потужності у 30 разів кожних 10 років, розвиток штучного інтелекту виграв від одночасних інновацій. Таким чином, він рухається значно швидше. За словами Дженсена Хуанга з NVIDIA: “Вперше ми бачимо складені експоненти… Ми складаємо у мільйон разів кожних 10 років. Не у сотню разів, не у тисячу разів, а у мільйон разів”. Без перебільшення ми є свідками найшвидшої технології в історії людства.

Потенціал тут величезний: автоматизуючи та масштабуючи керування високоякісними даними для штучного інтелекту, ми вирішуємо проблему, яка перешкоджає ширшому прийняттю штучного інтелекту. Виклики нагадують ранньоденні перешкоди в попередніх технологічних епохах: сілі, відсутність найкращих практик, обмеження для некваліфікованих користувачів та нестача добре визначених абстракцій.

Encord Index позиціонується як ключовий інструмент для керування та кураторства даних штучного інтелекту. Як він відрізняється від інших платформ керування даними, які зараз доступні?

Є кілька способів, як Encord Index виділяється:

Index масштабований: Дозволяє користувачам керувати мільярдами, а не мільйонами, пунктів даних. Інші інструменти стикаються з проблемами масштабованості для неструктурованих даних та обмежені у консолідації всіх відповідних даних у організації.

Index гнучкий: Інтегрується безпосередньо з приватним сховищем даних та постачальниками хмарного сховища, такими як AWS, GCP та Azure. На відміну від інших інструментів, які обмежені одним постачальником хмарного сховища або внутрішньою системою сховища, Index є агностичним до місця розташування даних. Він дозволяє керувати даними з багатьох джерел із відповідним управлінням та контролем доступу, що дозволяє розробляти безпечні та відповідні додатки штучного інтелекту.

Index багатомодальний: Підтримує багатомодальний штучний інтелект, керуючи даними у вигляді зображень, відео, аудіо, тексту, документів та ін. Index не обмежений одним типом даних, як багато інструментів LLM сьогодні. Людська когніція багатомодальна, і ми вважаємо, що багатомодальний штучний інтелект буде в центрі наступної хвилі досягнень штучного інтелекту, яка замінить чат-ботів та інструменти LLM.

Якими способами Encord Index поліпшує процес вибору правильних даних для моделей штучного інтелекту, і який вплив це має на продуктивність моделі?

Encord Index поліпшує вибір даних, автоматизуючи кураторство великих наборів даних, допомагаючи командам ідентифікувати та зберегти лише найбільш відповідні дані, а також видаляти некінформативні або упереджені дані. Цей процес не тільки зменшує розмір наборів даних, але також суттєво покращує якість даних, використовуваних для навчання моделей штучного інтелекту. Наші клієнти побачили покращення моделей до 20%, досягнувши скорочення розміру набору даних на 35% та заощадивши сотні тисяч доларів у витратах на обчислення та анотацію даних.

З швидкою інтеграцією передових технологій, таких як модель Segment Anything від Meta, як Encord залишається попереду у швидкозмінному ландшафті штучного інтелекту?

Ми свідомо побудували платформу так, щоб вона могла швидко адаптуватися до нових технологій. Ми зосереджуємося на забезпеченні масштабованого, програмно-орієнтованого підходу, який легко інтегрує досягнення, такі як SAM, забезпечуючи, щоб наші користувачі були завжди оснащені останніми інструментами для підтримання конкурентоспроможності.

Ми плануємо залишатися попереду, зосереджуючись на багатомодальному штучному інтелекті. Платформа Encord вже може керувати складними типами даних, такими як зображення, відео та текст, тому, коли надходять подальші досягнення у багатомодальному штучному інтелекті, ми готові.

Які найпоширеніші виклики, з якими стикаються компанії при керуванні даними штучного інтелекту, і як Encord допомагає вирішувати ці проблеми?

Є три основні виклики, з якими стикаються компанії:

  • Погане організаційне керування даними та контролем: Коли підприємства готуються до реалізації рішень штучного інтелекту, вони часто зустрічаються з реальністю сілованої та неорганізованої даних, яка не готова до штучного інтелекту. Ці дані часто позбавлені сильного управління, що обмежує більшу частину їх використання у системах штучного інтелекту.
  • Недостатність людських експертів: Коли моделі штучного інтелекту вирішують усе більш складні проблеми, скоро виникне нестача людських експертів для підготовки та валідації даних. Коли вимоги компанії до штучного інтелекту зростають, масштабування цієї людської робочої сили є складним та дорогим.
  • Немасштабоване інструментарій: Ефективні моделі штучного інтелекту дуже голодні щодо даних, необхідних для налаштування, валідації, RAG та інших робочих процесів. Попереднє покоління інструментів не обладнане для керування кількістю даних та типами даних, необхідними для сучасних моделей виробництва.

Encord вирішує ці проблеми, автоматизуючи процес кураторства даних у масштабі, роблячи його простим для ідентифікації впливових даних з проблемними даними та забезпечення створення ефективних тренувальних та валідних наборів даних. Він використовує програмно-орієнтований підхід, який легко масштабується у залежності від змін потреб керування даними. Наші інструменти штучного інтелекту, допоміжні для анотації, дозволяють людським експертам максимізувати ефективність робочого процесу. Цей процес особливо важливий у галузях, таких як фінансові послуги та охорона здоров’я, де тренери штучного інтелекту є дорогими. Ми робимо простим керування та розуміння всіх неструктурованих даних організації, зменшуючи потребу у ручній праці.

Як Encord вирішує проблему упередженості даних та недопредставлених областей у наборах даних, щоб забезпечити справедливі та збалансовані моделі штучного інтелекту?

Вирішення проблеми упередженості даних є критично важливим для нас у Encord. Наша платформа автоматично ідентифікує та висвітлює області, де дані можуть бути упередженими, дозволяючи командам штучного інтелекту вирішувати ці проблеми до того, як вони вплинуть на продуктивність моделі. Ми також забезпечуємо, що недопредставлені області у наборах даних належним чином включені, що допомагає у розробці справедливіших та більш збалансованих моделей штучного інтелекту. Використовуючи наші інструменти кураторства, команди можуть бути впевнені, що їхні моделі тренуються на різноманітних та представницьких даних.

Encord最近 отримав 30 мільйонів доларів у рамках фінансування серії B. Як це фінансування прискорить вашу дорожню карту продукту та плани розширення?

30 мільйонів доларів у рамках фінансування серії B буде використано для значного збільшення розміру наших продукційних, інженерних та дослідницьких команд штучного інтелекту протягом наступних шести місяців та прискорення розробки Encord Index та інших нових функцій. Ми також розширюємо нашу присутність у Сан-Франциско з новим офісом, і це фінансування допоможе нам масштабувати операції для підтримки нашої зростаючої клієнтської бази.

Як наймолодша компанія штучного інтелекту з Y Combinator, яка підняла фінансування серії B, що ви приписуєте швидкому зростанню та успіху Encord?

Одна з причин, чому ми змогли зростати швидко, полягає у тому, що ми прийняли надзвичайно клієнто-орієнтований фокус у всіх областях компанії. Ми постійно спілкуємося з клієнтами, слухаємо їхні проблеми та “обіймаємо” їх, щоб досягти рішень. Зосереджуючись на потребах клієнтів, а не на гіпі, ми створили платформу, яка резонує з провідними командами штучного інтелекту у різних галузях. Наші клієнти були інструментальними у тому, щоб привести нас до того, де ми зараз. Наша здатність швидко масштабуватися та ефективно керувати складністю даних штучного інтелекту зробила нас привабливим рішенням для підприємств.

Ми також багато чим зобов’язані нашим колегам, партнерам та інвесторам, які працювали наполегливо, щоб просувати Encord. Робота з продукційними, інженерними та маркетинговими командами світового рівня мала величезний вплив на нашому зростанні.

Враховуючи зростаючу важливість даних у штучному інтелекті, як ви бачите еволюцію ролі платформ даних штучного інтелекту, таких як Encord, протягом наступних п’яти років?

Когда застосування штучного інтелекту зростає у складності, потреба у ефективних та масштабованих рішеннях керування даними буде лише зростати. Я вважаю, що кожне підприємство в кінцевому підсумку матиме відділ штучного інтелекту, так само, як сьогодні існують відділи інформаційних технологій. Encord буде єдиною платформою, яку їм знадобиться для керування величезними кількостями даних, необхідних для штучного інтелекту, та швидкого виходу моделей у виробництво.

Дякуємо за велике інтерв’ю. Читачам, які бажають дізнатися більше, слід відвідати Encord.

Антуан є видним лідером і засновником Unite.AI, який рухає невпинною пристрастю до формування та просування майбутнього штучного інтелекту та робототехніки. Як серійний підприємець, він вважає, що штучний інтелект буде таким же революційним для суспільства, як і електрика, і часто захоплюється потенціалом деструктивних технологій та AGI.

Як футуролог, він присвячений дослідженню того, як ці інновації сформують наш світ. Крім того, він є засновником Securities.io, платформи, орієнтованої на інвестування в передові технології, які переінакшують майбутнє та змінюють цілі сектори.