стуб Џеј Мишра, извршни директор компаније Астера Софтваре - Серија интервјуа - Уните.АИ
Повежите се са нама

Интервјуи

Џеј Мишра, извршни директор компаније Астера Софтваре – серија интервјуа

mm
Ажурирано on

Јаи Мисхра је главни оперативни директор (ЦОО) у Астера Софтваре, брзорастући провајдер решења за податке спремних за предузећа. Они помажу пословним корисницима да премосте јаз између података и увида помоћу пакета лаког, али и високог учинка екстракције података, квалитета података, интеграције података, складиштења података и решења електронске размене података, која користе и компаније средње величине и компаније са листе Фортуне 500. у низу индустрија.

Шта вас је на почетку привукло информатици?

Увек сам имао дубоко укорењену страст за математиком, а мој пут у компјутерске науке био је природни наставак тога. Моје додипломско образовање је било из математике и рачунарства, и логичан напредак из света математике у област рачунарства ме је фасцинирао. Оно што је посебно привукло моју пажњу су замршени рад алгоритама и напредни алгоритамски процеси који су ме навели да наставим специјализацију из алгоритама током мог мастер студија из рачунарства. Од тада, моја веза са рачунарством је остала јака и стално се трудим да будем у току са најновијим достигнућима у овој области.

Тренутно сте ЦОО компаније Астера, да ли бисте могли да поделите са нама шта подразумева ваша свакодневна улога?

Као ЦОО компаније Астера, моја улога је вишеструка, што одражава динамичну природу наше компаније. У компанији Астера сам од њеног оснивања, а моје одговорности су се кретале кроз различите области организације. Ово укључује све, од активног доприноса развоју и кодирању наших производа до осигуравања да су наше карактеристике усклађене са растућим потребама наших купаца. Блиско сарађујем са нашим клијентима, радећи у тандему са њима на побољшању наших решења. Моја улога се протеже даље од самог развоја производа и обухвата продају и маркетинг, где своју понуду износимо на тржиште.

Како смо у фази раста, преузео сам додатне одговорности, укључујући надгледање наших циљева прихода и стратешко ширење нашег портфеља производа како бисмо досегли нова тржишта. У суштини, учествујем у скоро сваком аспекту нашег пословања, обезбеђујући да не само да правимо изузетне производе већ и да их успешно пласирамо на тржиште и испуњавамо наше пословне циљеве.

За читаоце који нису упознати са овим термином, шта је складиштење података?

Складиште података је архитектонски образац који се користи за консолидацију свих података вашег предузећа у централизовано спремиште које ће служити као основа из које можете генерисати различите типове аналитике, извештаја и контролне табле који ће представљати праву слику о томе где се налази ваше пословање. је и такође предвиђа како ће се пословање одвијати у будућности. Да бисте задовољили све то, своје податке обједињујете на одређени начин и та архитектура се зове складиште података.

Термин је заправо преузет из стварног складишта где се ваши производи чувају на организованим полицама. Али када дођете у свет података, доносите своје податке из различитих извора. Доносите своје податке из производње, ваше веб странице, ваших купаца, продаје и маркетинга, финансија и вашег одељења за људске ресурсе. Сакупите све податке, доведете их на једно место, и то је оно што ће се звати складиште података и дизајнирано је на одређени начин тако да ће извештавање, посебно засновано на временској линији, бити лако. То је основна сврха складишта података.

Који су неки од кључних трендова у складиштењу података данас?

Складиштење података је прилично еволуирало у последњих 20-25 година. Пре отприлике деценију, били смо сведоци појаве аутоматизованог складиштења података, промене парадигме која је убрзала процес изградње модела података и складишта података. Недавно је аутоматизација заузела централно место. Он се бави понављајућом природом задатака складиштења података, поједностављујући процесе ради уштеде времена и ресурса.

Наш производ, Астера Дата Варехоусе Буилдер, на пример, нуди холистички приступ аутоматизацији у складиштењу података. Покрива све, од аутоматизације ЕТЛ (Ектрацт, Трансформ, Лоад) цевовода и моделирања података до аутоматског учитавања података у структуре као што су звездасте шеме или трезори података. Штавише, он ефикасно одржава ове структуре кроз механизме Цханге Дата Цаптуре (ЦДЦ). Ова свеобухватна аутоматизација се појавила као кључни тренд у окружењу складиштења података.

Штавише, најновији тренд је фузија између складиштења података и вештачке интелигенције (АИ). Конкретно, генеративна АИ је подигла аутоматизацију на нове висине. Не само да аутоматизује задатке већ и помаже корисницима у доношењу одлука.

Конфигурисање компоненти складишта података, цевовода и тачака одлучивања може бити вођено АИ, чинећи складиште података моћнијим и ефикаснијим него икада раније. У суштини, ово је аутоматизација на стероидима и трансформише пејзаж складиштења података. Раскрсница између вештачке интелигенције и складиштења података је тренд који обећава велика будућност.

Која су четири основна принципа која предузећа треба да узму у обзир за развој свог складишта података?

1. Дефинисање јасних циљева

Од суштинског је значаја да почнете тако што ћете тачно разумети шта вам је потребно од складишта података. Избегните уобичајену замку прикупљања прекомерних података без јасне сврхе. Уместо тога, идентификујте специфичне циљеве које желите да постигнете са својим складиштем података. Које извештаје и увиде тражите? Фокусирајући се на своје циљеве, можете осигурати да уносите само релевантне податке, умјесто да неселективно гомилате огромне количине информација. С обзиром на смањење трошкова складиштења и рачунарске снаге, кључно је користити ове ресурсе интелигентно и етички.

2. Одабир правог архитектонског узорка

Архитектонски обрасци су веома важни. Они одлучују да ли ће ваше решење за складиштење података бити успешно или не. Постоје различите опције, у распону од складишта података у Инмон стилу до звезданих шема Ралпха Кимбалла, као и новијих образаца као што је Дата Ваулт и приступа једне велике табеле који заговарају продавци база података цолумна. Неће сви обрасци бити прикладни за сваки сценарио.

Углавном видимо комбинацију звездасте шеме која се налази на врху трезора података. Дакле, комбинација трезора података и шеме звезда је и даље најчешће коришћени образац. Али, као што сам рекао, за сваки захтев или за сваки сценарио биће другачији одговор. Зато прођите кроз стручњаке, видите који архитектонски образац је добар за ваш сценарио.

3. Избор правих алата

Они су веома важни и поново чине огромну разлику у времену и изворима потребним за прављење решења, као и на тачност и квалитет вашег решења који је одређен производима које ћете користити за прављење решења. складиште података и одржавати га. Обратите много пажње на могућности производа и погледајте производе који могу да испуне највише захтева под једним кишобраном. Постоје одређене области као што су ЕТЛ (Ектрацт, Трансформ, Лоад), квалитет података, моделирање података, учитавање података и објављивање података, све играју значајну улогу. Ако покушате да користите више производа за сваку од ових области, биће тешко. Дакле, погледајте производе који се могу користити за већину, ако не и за све различите састојке.

4. Ваш тим

На крају, али не и најмање важно, тим људи које окупљате да изградите решење за складиште података је најважнији део. Препоручујемо да имате некога са јаким искуством у обрасцима архитектуре података. Што се тиче састава тима, унакрсни функционални тимови су најбољи начин да то урадите, где имате мешавину пословних корисника и људи са неким програмским искуством или барем експертизом за податке и који имате блиску сарадњу између ваших чувара података, људи који су задужени за податке и наравно за пословање. Негујући блиску сарадњу између ових различитих аспеката ваше организације, можете створити кохезиван и ефикасан тим одговоран за изградњу и одржавање вашег решења за складиштење података.

Успех у складиштењу података зависи од постизања равнотеже између ова четири принципа. Ови принципи, када се пажљиво поштују, показали су се као рецепт за успех у нашем искуству.

Зашто је компанијама потребан модеран стек података?

Зависи од тога како дефинишемо "модеран" и то се стално мења, понекад по години, месецу, па чак и по дану. Морамо узети у обзир савремене скупове алата дизајнираних са променљивим пејзажом података на уму. Током протеклих неколико година дошло је до значајних промена у природи и обиму података. Успон великих података је трансформисао пејзаж података, са подацима који пристижу из извора као што су веб странице за е-трговину, производне базе података и различити делови вашег пословања. Ови подаци се мењају не само по обиму већ и по својој природи.

У прошлости су подаци углавном били структурирани, али сада неструктурирани подаци играју значајну улогу. Поред тога, повећана је брзина којом се подаци генеришу и стављају на располагање за употребу. С обзиром на ове промене у подацима, морамо континуирано да процењујемо и прилагођавамо наш скуп алата како бисмо ефикасно одговорили на ове изазове у развоју података.

Савремени стек података је дизајниран да обради све варијације у структурама и брзини података, и добро је опремљен да се прилагоди новим архитектонским обрасцима који су еволуирали у последњих неколико година. Стога, ако желите да на најбољи начин искористите своје податке, морате да погледате како да модернизујете свој скуп података. То је једини начин да будете у току са новим изазовима података.

Видели смо да се компаније држе постојећих решења за која се чини да функционишу. Кључно је препознати да су подаци сами по себи динамични. Непрестано се развија, представљајући нове изазове и могућности. Постојећа решења можда нису опремљена да се прилагоде овим променама. Стога, да би искористиле пуни потенцијал својих података, компаније морају да прихвате концепт модернизације своје групе података. Не ради се о разбијању онога што функционише; ради се о томе да останете агилни и да реагујете на природу података која се развија. Континуирано процењујући и интегришући напредак у технологији података, предузећа могу остати конкурентна и доносити одлуке засноване на информацијама у свету који се све више ослања на податке.

Који су неки од тренутних изазова управљања подацима који се виде у индустрији?

1. Брзина података и интеграција

Један од великих изазова са којима се данас суочавамо је огроман обим података који пристижу из различитих апликација. Ако узмете у обзир било коју типичну ИТ организацију, она се бави новим апликацијама које се појављују све време – десетине, понекад чак и стотине сваке године, посебно у организацијама средње величине.

Сада, све ове апликације генеришу податке и ти подаци садрже вредне увиде. Примарна брига овде је могућност да се ови нови извори података брзо интегришу у постојеће цевоводе података и консолидују у јединствени приказ. Брзина којом се организације могу прилагодити и инкорпорирати ове нове токове података највећи је изазов који видимо.

2. Различити формати података

Још један критичан изазов произилази из природе самих података, посебно све веће заступљености неструктурираних података. Са неструктурираним подацима, наравно, постоје различите школе мишљења о томе како се њима поступа.

Организације морају одлучити да ли ће ове податке ускладиштити директно у језерима података за каснију употребу или их издвојити и трансформисати у структуриранији формат за тренутну употребу. Изазов како поступати са неструктурираним подацима остаје, а видимо да чак и средња или мала предузећа утичу на то. Дакле, осмишљавање ефикасних стратегија за руковање неструктурираним подацима је од суштинског значаја.

3. Објављивање и дељење података

Иако су интеграција и консолидација података од кључне важности, способност ефективне дељења података је подједнако важна. Организацијама су потребни механизми за објављивање и дистрибуцију података интерним одељењима, независним добављачима, партнерима и другим заинтересованим странама. Овај изазов се протеже даље од једноставног омогућавања приступа подацима; то укључује осигурање сигурности података, приватности и усклађености са прописима. Како дељење података постаје неопходност за предузећа свих величина, технологије и производи у овом простору брзо се развијају како би задовољили потражњу.

На које начине је Астера интегрисала вештачку интелигенцију у радни ток корисника?

Гледамо на АИ који се укршта са управљањем подацима на два различита начина.

1. Побољшање употребљивости помоћу генеративне АИ

Наша дубока посвећеност употребљивости је камен темељац наше филозофије развоја производа. Током последњих 12 до 13 година, изградили смо јаку репутацију за дизајнирање производа са кратком кривом учења, чинећи их доступним чак и корисницима који нису технички. Уз само скромну количину обуке, појединци могу ефикасно да користе наше производе за обављање значајних задатака са својим подацима.

Са увођењем генеративне вештачке интелигенције, Астера је подигла употребљивост на виши ниво. Користили смо генеративну вештачку интелигенцију да креирамо кориснички интерфејс који омогућава клијентима да комуницирају са производом користећи команде природног језика. Овај интерфејс вођен АИ поједностављује задатке конфигурисања, чинећи га интуитивнијим и ефикаснијим за кориснике.

Штавише, Астера има интегрисану аутоматизацију коју покреће вештачка интелигенција за руковање задацима који су раније захтевали неколико сати ручног рада, посебно у конфигурацији производа за управљање подацима. Највећи фактор трошкова изградње решења за управљање подацима није била само куповина производа, већ су време и труд утрошени на његово конфигурисање. Покушали смо да то решимо помоћу вештачке интелигенције. Овај приступ значајно смањује време и ресурсе који се традиционално троше на конфигурацију производа.

На пример, Астерин производ, РепортМинер, поједностављује екстракцију података из неструктурираних докумената омогућавајући корисницима да креирају шаблоне за издвајање на основу правила. АИ сада може да генерише почетни шаблон за неколико секунди, задатак који је раније трајао два до три сата за типичног корисника. Први рез шаблона генерисаног вештачком интелигенцијом можда није савршен, али обрађује приближно 90% радног оптерећења, омогућавајући корисницима да изврше брза подешавања и заврше задатак за неколико минута уместо сати. Овај приступ је само један пример како Астера користи вештачку интелигенцију да побољша употребљивост свих својих производа.

Радимо сличне ствари у целом нашем скупу података где добијамо значајно повећање употребљивости са вештачком интелигенцијом.

2. АИ функционалност као скуп алата

Астера нуди обједињени стек података који покрива различите аспекте управљања подацима, укључујући унос, трансформацију, квалитет података, складиштење података, АПИ-је и објављивање података. Компанија препознаје важност пружања АИ функционалности као свестраног скупа алата за своје кориснике. У оквиру овог скупа алата, Астерини клијенти могу да приступе вештачкој интелигенцији у читавом спектру науке о подацима, од изградње и примене модела машинског учења до руковања МЛ операцијама (операције машинског учења). Астера такође подржава употребу модела заснованих на отвореном коду, укључујући велике језичке моделе (ЛЛМ), и олакшава фино подешавање за специфичне случајеве употребе.

Ова шира АИ функционалност омогућава Астериним корисницима да искористе АИ за различите задатке у вези са подацима, укључујући примену модела машинског учења, имплементацију МЛ операција и фино подешавање модела отвореног кода. Поред тога, Астера континуирано ради на проширењу подршке за вештачку интелигенцију, обухватајући области као што су векторске базе података, претраге сличности, уградње и још много тога.

Које су неке од најбољих пракси за коришћење АИ и МЛ модела у управљању подацима за велике компаније?

1. Останите на челу развоја АИ и МЛ

Област великих језичких модела се брзо развија. Да би стекле конкурентску предност, велике компаније треба да буду информисане о најновијим достигнућима. Астера је, на пример, рано усвојила генеративну вештачку интелигенцију, користећи моделе као што су ОпенАИ и ЛАМА. Континуирано праћење нових технологија осигурава да сте добро припремљени да их ефикасно искористите.

2. Експериментишите са више модела и конфигурација

Користећи фино подешавање ЛЛМС-а, били смо у могућности да применимо мале величине, као што су модели са 8 до 13 милијарди параметара, и да их применимо локално. То је нешто што нам је заиста добро функционисало и оно што препоручујемо је да уместо да користите само један у односу на други, испробате различите основне моделе и различите конфигурације и видите који вам одговара.

Велики језички модели долазе у различитим укусима, сваки са својим јединственим могућностима. Направите конфигурацију која вам омогућава да бирате из широког спектра опција, одражавајући оно што програмери и научници података раде на својим путовањима у области науке о подацима.

Да бисмо оснажили кориснике, креирали смо конфигурациони систем који нуди широку лепезу опција, слично ономе са чиме се сусрећу програмери и научници података када раде са библиотекама отвореног кода у својим подухватима вођеним подацима. Наш циљ је био да неприметно интегришемо ове опције у наш производ, омогућавајући корисницима динамично и прилагодљиво искуство.

3. Дајте приоритет локалној примени у односу на АПИ-је

Када се ради о производима усмереним на податке, смањење кашњења је најважније. Ослањање искључиво на АПИ-је за приступ АИ и МЛ моделима може довести до неприхватљивих кашњења, посебно када се рукује великим количинама података. Препоручљиво је да дате приоритет локалној примени фино подешених модела, посвећених вашем специфичном сценарију. Овај приступ може значајно побољшати време одговора и укупне перформансе.

Зашто је Астера супериорно решење од конкурентских платформи?

  • Астерина решења имају интуитиван, визуелни интерфејс без кода, заједно са побољшаном употребљивошћу коју покреће вештачка интелигенција, што олакшава извршавање сложених процеса података за све кориснике, без обзира на њихове техничке способности.
  • Функције аутоматизације нашег скупа података смањују поновљиве ручне задатке и штеде време и развојне ресурсе.
  • Наша обједињена платформа може помоћи корисницима да извршавају процесе података од краја до краја без промене решења. Ово елиминише трошкове учења и управљања вишеструким изолованим системима.

Хвала вам на одличном интервјуу, читаоци који желе да сазнају више треба да посете Астера Софтваре.

Оснивачки партнер уните.АИ и члан Форбсов технолошки савет, Антоан је а футуристички који је страствен за будућност вештачке интелигенције и роботике.

Такође је оснивач Сецуритиес.ио, веб локација која се фокусира на улагање у дисруптивну технологију.