Connect with us

Frank Liu, Директор з операцій у Zilliz – Серія інтерв’ю

Інтерв’ю

Frank Liu, Директор з операцій у Zilliz – Серія інтерв’ю

mm

Frank Liu є Директором з операцій у Zilliz, провідному постачальнику векторних баз даних і технологій штучного інтелекту. Вони також є інженерами та вченими, які створили LF AI Milvus®, найпопулярнішу відкриту векторну базу даних у світі.

Що спочатку привернуло вашу увагу до машинного навчання?

Моя перша зустріч з потужністю ML/AI відбулася під час навчання в Стенфорді, хоча це було трохи віддалено від моєї спеціальності (електротехніка). Спочатку мене привернула електротехніка як галузь через здатність витягувати складні електричні та фізичні системи у математичні наближення, що відчувалося дуже потужно для мене, і статистика та машинне навчання відчувалися подібно. Я закінчив навчання додатковими курсами з комп’ютерного зору та машинного навчання під час аспірантури, і я написав свою магістерську дисертацію про використання ML для оцінки естетичної краси зображень. Все це призвело до моєї першої роботи в команді комп’ютерного зору та машинного навчання в Yahoo, де я перебував у гібридній ролі дослідження та розробки програмного забезпечення. Ми ще були у дні до AlexNet та VGG, і бачити, як вся галузь та індустрія рухаються так швидко, від підготовки даних до масивного паралельного навчання моделей до впровадження моделей у виробництво, було дивовижним. У багатьох аспектах це здається трохи смішним використовувати фразу “тоді” для чогось, що відбулося менше 10 років тому, але такий є прогрес, досягнутий у цій галузі.

Після Yahoo я служив технічним директором стартапу, який я заснував, де ми використовували ML для індор-локалізації. Там нам довелося оптимізувати послідовні моделі для дуже малих мікроконтролерів – це була зовсім інша, але пов’язана інженерна задача з сучасними великими моделями мови та дифузійними моделями. Ми також будували апаратне забезпечення, панелі для візуалізації та прості хмарні додатки, але AI/ML завжди служили основним компонентом роботи, яку ми виконували.

Хоча я перебуваю в машинному навчанні чи поруч з ним уже близько 7 чи 8 років, я все ще зберігаю велику любов до проектування схем та цифрової логіки. Маєючи досвід у галузі електротехніки, це дуже корисно для багатьох робіт, у яких я зараз займаюсь. Багато важливих концепцій у цифровому проектуванні, таких як віртуальна пам’ять, передбачення гілок та паралельне виконання в HDL, надають повний вигляд багатьох ML та розподілених систем сьогодні. Хоча я розумію привабливість CS, я сподіваюся побачити відродження традиційних інженерних галузей – електротехніки, механіки, хімічної інженерії тощо – протягом наступних кількох років.

Для читачів, які незнайомі з цим терміном, що таке неструктуровані дані?

Неструктуровані дані відносяться до “складних” даних, які є суттєво даними, які не можуть бути збережені у попередньо визначеному форматі або підходити до існуючої моделі даних. Для порівняння, структуровані дані відносяться до будь-якого типу даних, який має попередньо визначену структуру – числові дані, рядки, таблиці, об’єкти та ключові/значення сховища – все це приклади структурованих даних.

Щоб дійсно зрозуміти, що таке неструктуровані дані та чому вони традиційно були важкими для обчислювальної обробки, це допомагає порівняти їх зі структурованими даними. У найпростіших термінах традиційні структуровані дані можуть бути збережені через реляційну модель. Наприклад, реляційна база даних з таблицею для зберігання інформації про книги: кожен рядок у таблиці міг би представляти окрему книгу, індексовану за номером ISBN, тоді як стовпці позначали б відповідну категорію інформації, таку як назва, автор, дата публікації тощо. Сьогодні існують більш гнучкі моделі даних – ширококолоночних сховища, об’єктні бази даних, графові бази даних тощо. Але загальна ідея залишається такою ж: ці бази даних призначені для зберігання даних, які підходять певній формі даних або моделі даних.

Неструктуровані дані, з іншого боку, можна вважати псевдовипадковим блоком бінарних даних. Вони можуть представляти все, бути довільно великими або малими та можуть бути перетворені та прочитані одним із безлічі різних способів. Це робить їх неможливими для підходу до будь-якої моделі даних, не кажучи вже про таблицю в реляційній базі даних.

Які приклади цього типу даних?

Людські дані – зображення, відео, аудіо, природні мови тощо – є хорошими прикладами неструктурованих даних. Але існують різноманітні менш буденні приклади неструктурованих даних. Профілі користувачів, структури білків, геномі послідовності та навіть людсько-читані коди також є хорошими прикладами неструктурованих даних. Основна причина, через яку неструктуровані дані традиційно були такими важкими для управління, полягає в тому, що неструктуровані дані можуть мати будь-яку форму та можуть потребувати суттєво різних часів виконання для обробки.

Використовуючи зображення як приклад, два фотознімки однієї й тієї ж сцени могли б мати суттєво різні значення пікселів, але обоє мають схожий загальний зміст. Природна мова – це ще один приклад неструктурованих даних, який я люблю називати. Фрази “Електротехніка” та “Комп’ютерні науки” дуже тісно пов’язані – так тісно, що будівлі електротехніки та комп’ютерних наук у Стенфорді розташовані поруч одна з одною – але без способу закодувати семантичне значення за цими двома фразами комп’ютер може наївно подумати, що “Комп’ютерні науки” та “Соціальні науки” більш пов’язані.

Що таке векторна база даних?

Щоб зрозуміти векторну базу даних, спочатку потрібно зрозуміти, що таке вкладення. Я поясню це коротко, але коротка версія полягає в тому, що вкладення – це високовимірний вектор, який може представляти семантику неструктурованих даних. Загалом, два вкладення, які знаходяться поруч один з одним у термінах відстані, дуже ймовірно відповідають семантично подібним вхідним даним. З сучасним ML, ми маємо можливість кодувати та перетворювати різноманітні типи неструктурованих даних – зображення та текст, наприклад – у семантично потужні векторні вкладення.

З точки зору організації неструктуровані дані стають надзвичайно важкими для управління, коли їх кількість зростає понад певний ліміт. Саме тут вступає в дію векторна база даних, така як Zilliz Cloud. Векторна база даних створена для зберігання, індексування та пошуку великих кількостей неструктурованих даних шляхом використання вкладень як основної репрезентації. Пошук у векторній базі даних зазвичай здійснюється за допомогою запитів-векторів, а результатом запиту є топ-N найбільш схожих результатів на основі відстані.

Найкращі векторні бази даних мають багато функцій зручності традиційних реляційних баз даних: горизонтальне масштабування, кешування, реплікація, відключення та виконання запитів – лише деякі з багатьох функцій, які справжня векторна база даних повинна реалізувати. Як визначення категорії, ми були активні в академічних колах, опублікувавши статті в SIGMOD 2021 та VLDB 2022, два найкращі конференції з баз даних сьогодні.

Чи можете ви обговорити, що таке вкладення?

Загалом кажучи, вкладення – це високовимірний вектор, який походить з активацій проміжного шару у багатошаровій нейронній мережі. Багато нейронних мереж тренуються для виводу вкладень самих по собі, а деякі застосування використовують конкатеновані вектори з кількох проміжних шарів як вкладення, але я не буду вдаватися у це зараз. Інший менш поширений, але не менш важливий спосіб генерації вкладень – через ручні ознаки. Замість того, щоб мати модель ML, яка автоматично вивчає правильні репрезентації для вхідних даних, добра стара інженерія ознак може працювати для багатьох застосувань також. Незалежно від основної методики, вкладення для семантично подібних об’єктів знаходяться поруч один з одним у термінах відстані, і це властивість є тією, яка живить векторні бази даних.

Які найпопулярніші випадки використання цієї технології?

Векторні бази даних ідеальні для будь-якого застосування, яке вимагає певної форми семантичного пошуку – рекомендація продуктів, аналіз відео, пошук документів, виявлення загроз та шахрайства та чатботи, підтримувані штучним інтелектом, – деякі з найпопулярніших випадків використання векторних баз даних сьогодні. Для прикладу, Milvus, відкрита векторна база даних, створена Zilliz і основа Zilliz Cloud, була використана понад тисячою підприємств у різних випадках використання.

Мене завжди радує обговорювати ці застосування та допомогти людям зрозуміти, як вони працюють, але я також дуже люблю обговорювати менш відомі випадки використання векторних баз даних. Відкриття нових ліків – один із моїх улюблених “нішевих” випадків використання векторних баз даних. Виклик для цього застосування полягає у пошуку потенційних кандидатів на ліки для лікування певної хвороби або симптому серед бази даних з 800 мільйонами сполук. Одна фармацевтична компанія, з якою ми спілкувалися, змогла суттєво покращити процес відкриття ліків, а також скоротити апаратні ресурси, поєнувши Milvus з хемінформатичною бібліотекою RDKit.

Інший приклад – це AI ArtLens Клівлендського музею мистецтва (CMA). AI ArtLens – це інтерактивний інструмент, який приймає запит-зображення як вхідні дані та витягує візуально схожі зображення з бази даних музею. Це зазвичай називається зворотнім пошуком зображень і є досить поширеним випадком використання векторних баз даних, але унікальна цінність, яку Milvus надала CMA, полягала у тому, щоб отримати додаток, готовий до роботи протягом тижня з дуже маленькою командою.

Чи можете ви обговорити, що таке відкрита платформа Towhee?

Під час спілкування з людьми з спільноти Milvus ми виявили, що багато хто з них хотів мати уніфікований спосіб генерації вкладень для Milvus. Це було правдою майже для всіх організацій, з якими ми говорили, але особливо для компаній, які не мали багатьох інженерів-міжнародників. З Towhee ми намагаємося вирішити цю проблему через те, що ми називаємо “векторною обробкою даних ETL”. Хоча традиційні конвеєри ETL фокусуються на поєднанні та перетворенні структурованих даних з кількох джерел у використовуваний формат, Towhee призначена для роботи з неструктурованими даними та явно включає ML у результуючий конвеєр ETL. Towhee досягає цього, надаючи сотні моделей, алгоритмів та перетворень, які можуть бути використані як будівельні блоки у конвеєрі векторної обробки даних ETL. Крім того, Towhee пропонує легке у використанні Python API, яке дозволяє розробникам будувати та тестувати ці конвеєри ETL у одному рядку коду.

Хоча Towhee є самостійним проєктом, це також частина ширшої екосистеми векторних баз даних, центром якої є Milvus, яку створює Zilliz. Ми бачимо Milvus і Towhee як два висококомплементарні проєкти, які, коли використовуються разом, можуть дійсно демократизувати обробку неструктурованих даних.

Zilliz недавно підняв 60 мільйонів доларів у рамках серії B. Як це прискорить місію Zilliz?

Я хотів би спочатку подякувати Prosperity7 Ventures, Pavilion Capital, Hillhouse Capital, 5Y Capital, Yunqi Capital та іншим за те, що вони повірили в місію Zilliz і підтримали нас цією серією B. Ми тепер підняли загалом 113 мільйонів доларів, і цей останній раунд фінансування підтримає наші зусилля щодо масштабування інженерних та маркетингових команд. Зокрема, ми покращимо нашу керовану хмарну пропозицію, яка зараз знаходиться на ранній стадії доступу, але запланована до відкриття для всіх пізніше цього року. Ми також продовжимо інвестувати в передові дослідження баз даних та штучного інтелекту, як ми робили протягом останніх 4 років.

Чи є щось інше, що ви хотіли б поділитися про Zilliz?

Як компанія, ми ростемо швидко, але те, що дійсно відрізняє нашу поточну команду від інших у сфері баз даних та ML, – це наш унікальний запал до того, що ми будемо створювати. Ми на місії демократизувати обробку неструктурованих даних, і це абсолютно дивовижно бачити так багато талановитих людей у Zilliz, які працюють над спільною метою. Якщо будь-що з того, що ми робимо, здається вам цікавим, не вагайтесь зв’язатися з нами. Ми були б раді бачити вас на борту.

Якщо вам хочеться дізнатися трохи більше, я також особисто відкритий до обговорення Zilliz, векторних баз даних або пов’язаних з ними досягнень у сфері штучного інтелекту/ML. Моя (фігуративна) дверь завжди відкрита, тому не вагайтесь зв’язатися зі мною безпосередньо у Twitter/LinkedIn.

Останнє, але не менш важливе: дякую за читання!

Дякую за велике інтерв’ю, читачам, які бажають дізнатися більше, слід відвідати Zilliz.

Антуан є видним лідером і засновником Unite.AI, який рухає невпинною пристрастю до формування та просування майбутнього штучного інтелекту та робототехніки. Як серійний підприємець, він вважає, що штучний інтелект буде таким же революційним для суспільства, як і електрика, і часто захоплюється потенціалом деструктивних технологій та AGI.

Як футуролог, він присвячений дослідженню того, як ці інновації сформують наш світ. Крім того, він є засновником Securities.io, платформи, орієнтованої на інвестування в передові технології, які переінакшують майбутнє та змінюють цілі сектори.