кочан Сара Наги, основател и главен изпълнителен директор на Seek AI - Серия от интервюта - Unite.AI
Свържете се с нас

Интервюта

Сара Наги, основател и главен изпълнителен директор на Seek AI – Серия интервюта

mm

Публикуван

 on

Сара Наги е основател и главен изпълнителен директор на Търсете AI, платформа, която позволява на крайните бизнес потребители да задават на Seek точно същите въпроси, които задават в момента на екипа за данни, направо в Slack, Teams и имейл. Без „усъвършенстване“ на това как пишат въпроса си и без изучаване на нова платформа.

Първоначално сте започнали като изследовател с данни от космическия телескоп Хъбъл. Върху какво работихте?

Правех изследвания в UCLA и Caltech, разглеждайки някои от най-отдалечените галактики, които можеха да бъдат наблюдавани с телескоп, и работех върху анализирането на някои от техните свойства, като тяхната маса и размер. Целта на това изследване беше да ни помогне да разберем разликата между много далечни галактики и галактики, които са по-близо до нашите, и да разработим модели за това как тези галактики се формират с течение на времето.

След това сте работили като специалист по данни в различни стартиращи компании. Кои бяха някои от по-интересните проекти?

Един проект, който се откроява, включва използването на обработка на естествен език (NLP) за класифициране на неструктуриран текст, свързан с артикули на дребно. Например вземане на необработен текст (напр. „air jordans green“) и етикетиране като предполагаема марка („Nike“). Имах колега, специализирал в НЛП, който беше зает с различен проект, така че всъщност първоначално не трябваше да работя по този. В крайна сметка ми го дадоха, тъй като бяха заети. По онова време дори не знаех нищо за НЛП, така че преминах през някои безплатни курсове от Станфорд и Fast.ai, за да увелича знанията си. Наистина ми хареса да науча за НЛП и започнах да разбирам защо е толкова важно и защо възможността изкуственият интелект (AI) да разбира езика е голяма стъпка към така наречения „общ AI“. Това преживяване определено ме подтикна да разбера бързо важността на GPT-3, когато се появи за първи път.

Бихте ли споделили историята на генезиса зад Seek AI?

Когато се появи GPT-3 моделът на OpenAI, веднага разбрах какъв невероятен напредък е това и бях особено развълнуван от приложенията, включващи GPT-3 писане на код. В края на краищата аз пишех код по цял ден като учен по данни и да видя AI да прави това – и да генерира кода перфектно – беше потресаващо. Бих сравнил реакцията си към GPT-3 с първото научаване за VR през 2013 г., което беше друго изумително преживяване за мен. В крайна сметка реших, че трябва да създам стартъп, за да заложа на тази технология. Не знаех какво точно ще създам, но имах чувството, че ако науча повече за тези модели, нещо ценно ще дойде на мястото си.

След като наистина научих за моделите, тогава разбрах, че мога да реша проблемна точка, която срещах навсякъде, където бях работил като квант или като учен по данни. Въпросната болезнена точка беше, че бизнесмените нямаха правилните инструменти, за да отговорят на собствените си въпроси относно данните. Като учен по данни, често работех върху проблеми, които изискваха голямо съсредоточаване, но често бях прекъсван от колеги от страна на бизнеса, които имаха въпроси относно данните, което ме принуждаваше да спра това, което правех. Процесът изглеждаше архаичен и неефективен. Осъзнах, че ако се съсредоточа върху тази нова технология, която решава проблема, това ще бъде решение, определящо категорията на този много важен и повсеместен проблем.

Seek AI използва генеративен AI. Бихте ли обяснили на нашите читатели какво е това?

„Генеративен AI“ е много нашумяла модна дума, но за разлика от други модни думи, не вярвам, че рекламата е неоправдана. Терминът се отнася до големи модели за машинно обучение със стотици милиарди параметри, като Open AI's DALL-E намлява GPT-3. Иновацията на тези модели е, че те могат да разбират естествения език и да генерират текст, изображения, код и др. Ако някога си играете с DALL-E или Stable Diffusion, например, бързо ще разберете защо тези модели са толкова рекламирани; те имат невероятно човешка способност да разбират командите на естествен език и могат да създават изкуство, което съперничи на най-добрите човешки художници.

Генерирането на код е едно от най-нишовите, но най-важни приложения на генеративния AI. Данните стават все по-големи и по-сложни и следователно по-трудни за ръчно анализиране и организиране от хората. И все пак има толкова много информация, кодирана в тези данни. Тази информация е мощна не само за организациите, но и може да доведе до невероятни научни пробиви от академична страна. Изграждането на AI за извличане на стойност от данни ще отключи невероятна стойност под формата на полезна информация.

Seek AI изгражда интерфейс, който позволява на потребителите да взаимодействат с данни, използвайки естествен език. Работниците със знания имат достъп до естествения езиков интерфейс на Seek AI чрез имейл, Slack, текст и набор от системи за управление на взаимоотношенията с клиенти (CRM).

Какви други видове машинно обучение се използват в Seek AI?

Докато генеративният AI е част от нашата архитектура за машинно обучение, нашата архитектура също така включва няколко разклонения на модели за дълбоко обучение с отворен код. Трансформаторните модели (на които „генеративен AI“ е вариант) включват много (но не всички) от моделите, които Seek използва.

Защо е толкова важно за нетехническите потребители да имат бърз достъп до данни?

Каква е ползата от данните, ако не генерират възвръщаемост на инвестициите и как един бизнес може да получи тази възвръщаемост на инвестициите, ако потребителите, ориентирани към бизнеса, дори нямат достъп до тях? Ето защо е абсолютно важно да се даде достъп на възможно най-много хора, без да се прави компромис с точността.

Когато бях учен по данни, понякога получавах искания от главния изпълнителен директор да анализирам някои данни, за да помогна с продукта на нашата компания или стратегията за излизане на пазара. Тези проекти могат да отнемат седмици или повече. Като главен изпълнителен директор сега определено разбирам важността на тези проекти на по-дълбоко ниво, отколкото когато бях на страната на данните. Често се улавям, че ми се иска просто да получа данните на една ръка разстояние, за да мога да вземам решенията си по-бързо. Това е пример за това, което решаваме в Seek.

Как Seek AI прави тези данни толкова лесни за извличане?

Нещо, за което е интересно да се мисли, е, че данните наистина могат да бъдат анализирани само с код. Вярно е, че има платформи, които са абстракции над този код (напр. табла за управление на данни), но под капака има код, ръчно написан от анализатори на данни, който позволява данните да бъдат представени на крайните бизнес потребители.

Повечето работници на знанието не знаят как да кодират, не искат да кодират или просто не могат дори да получат достъп до данните, дори ако искат да напишат код, за да го анализират. Следователно, когато имат нужда от данни, трябва или да ги намерят в таблото за управление, или да попитат екипа за данни, ако не могат да ги намерят. Колкото по-големи стават наборите от данни, толкова повече ще се случва това.

Следователно екипите за данни трябва да бъдат „преводачи“ на въпросите на естествения език, насочени към тях, и на самите данни, към които те правят заявки, използвайки код. Премахването на този посредник „преводач“ е сърцето на това, което Seek прави.

Как предприятията гарантират, че данните, които използват, са точни?

Управлението на компромиса между точността на данните и достъпността е огромно предизвикателство. Както казах в скорошно интервю, от една страна, достъпността позволява на по-малко технически хора да започнат да взаимодействат с извора на знания, който са данните на компанията. От друга страна, каква е ползата от извор на замърсена вода (т.е. лоши данни)?

Най-добрите екипи за данни са тези, които управляват този компромис по възможно най-оптималния начин и голяма част от това е внимателно калибриране и проверка на всички инструменти, с които нетехническите потребители могат да взаимодействат.

Какви са някои примери за случаи на използване на платформата Seek AI?

Ние вече предоставяме стойност на клиенти и дизайнерски партньори във вертикалните пазари на B2B SaaS, Fintech, потребителски стоки (CPG) и B2C електронна търговия.

Бойна перка, например, е водещият пазар на алтернативни набори от финансови данни. Те вярват, че даването на бързи, висококачествени отговори на въпросите на собствените им клиенти е разликата между победата и загубата от техните конкуренти. Изпълнителният директор на компанията Тим Харингтън отбеляза: „Seek AI изигра критична роля в стратегията на нашата компания за 2023 г. поради предимството, което ни дава при достъпа и анализа на нашите 2,400+ набора от данни в отговор на въпроси на клиенти. Бих изчислил, че възвръщаемостта на инвестициите ни в Seek AI е около 10 пъти въз основа на това, което бихме похарчили, за да постигнем това ниво на ефективност без платформата.“

Има ли нещо друго, което бихте искали да споделите за Seek AI?

Това може да е правилното място за безсрамен щепсел. Понастоящем Seek предлага безплатни изпробвания на нашата платформа, които могат да бъдат достъпни на seek.ai. Ние сме развълнувани да бъдем пионери във въвеждането на генеративен AI в екипите за данни и очаквам с нетърпение да тръгнем по това пътешествие с нашите клиенти.

Благодаря ви за страхотното интервю, читателите, които искат да научат повече, трябва да го посетят Търсете AI.

Основател на unite.AI и член на Технологичен съвет на Forbes, Антоан е а футурист който е страстен за бъдещето на AI и роботиката.

Той е и основател на Ценни книжа.io, уебсайт, който се фокусира върху инвестирането в революционни технологии.