stub Fabiana Clemente, medstifter og Chief Data Officer hos YData - Interview Series - Unite.AI
Følg os

Interviews

Fabiana Clemente, medstifter og Chief Data Officer hos YData – Interview Series

mm
Opdateret on

Fabiana Clemente er medstifter og Chief Data Officer hos YData. YData er en AI-startup, der skabte den første datacentrerede udviklingsløsning til at kombinere dataopdagelse, forbedring og skalering i én enkelt platform.

Hvad tiltrak dig oprindeligt til kunstig intelligens og maskinlæring?

Min baggrund er i anvendt matematik, hvor jeg tilføjer muligheden for at lære og forstå, hvordan vi kan trække information ud af data samt gøre det ved at udnytte kode. På det tidspunkt var det ikke så sexet som Machine Learning, men det var bestemt det, der udløste min passion for området.

Kunne du dele tilblivelseshistorien bag Ydata?

Som Data Scientist, der har arbejdet for både startups og virksomheder, havde jeg min rimelige andel af problemer - nogle gange blev adgangen til data blokeret under forudsætning af sikkerhed eller privatliv, andre gange var adgangen nem, men kvaliteten af ​​dataene var ikke ens. tæt på, hvad der skulle til for at bygge Ai-baserede løsninger. At vide, at disse kampe er meget hyppige i de fleste organisationer, inspirerede os til at starte virksomheden med det mål at hjælpe disse teams med at overvinde disse forhindringer ved at accelerere deres AI-udvikling med forbedrede data.

Kan du beskrive for vores publikum, hvad syntetiske data er?

Syntetiske data anses for at være data, der ikke blev genereret i den virkelige verden, så alle data, der er skabt kunstigt. Der er metoder, der muliggør generering af syntetiske data – fra regelbaserede strategier hele vejen til at bruge Machine eller Deep Learning-modeller til at lære disse "regler" for os. Hos YData adopterede og specialiserede vi os i en Deep Learning-baseret strategi for at generere nye data, der holder adfærden fra begivenheder i den virkelige verden uden bekymringer omkring privatlivets fred.

Hvad gør syntetiske data så vigtige?

Jo mere organisationer indser vigtigheden af ​​data for at booste deres virksomheder, jo mere vil betydningen og rollen af ​​syntetiske data blive forstået. Indsamling af rigtige data er ikke kun tidskrævende og dyrt, men også nogle gange umuligt. For at kunne bygge AI-applikationer er data et hårdt krav – det er her, syntetiske data kommer til undsætning. Evnen til at generere usete scenarier eller blot at låse op for adgangen til data er nøglen til at udvikle sig i en verden, hvor pionerer, som f.eks. Andrew Ng, siger, at det at blive datacentreret er nøglen til en vellykket AI-adoption.

I selvkørende biler eller andre maskinautomatiseringsaktiviteter kan vi allerede opfatte vigtigheden af ​​syntetiske data, så jeg vil sige, at det er helt naturligt, at denne forståelse spreder sig på tværs af alle brancher.

Hvordan genererer Ydata syntetiske data?

YData udnytter hovedsageligt Deep Generative-modeller for at lære de statistiske attributter og korrelationer mellem variabler i de originale data. Dette gør det muligt for modellen at generere et statistisk relevant datasæt, der har samme forretningsværdi som det originale, uden at tillade sporbarhed til de originale poster.

YData skubber denne teknologi fremad og er virksomheden bag Syntetisk datafællesskab – en gruppe af datavidenskabseksperter, der er forpligtet til at evangelisere og hjælpe enhver, der ønsker at lære og bruge denne teknologi.

Hvordan hjælper Ydata-platformen med at opdage og låse op for nye datakilder?

YDatas platform inkluderer indbyggede connectors til enhver type database, datavarehus eller datasø, som giver brugerne mulighed for nemt at få adgang til relevante metadata og forstå, om de eksisterende data er nyttige til at besvare det forretningsspørgsmål, de har ved hånden – uden selv at se ved de rigtige poster.

Kan du dele nogle detaljer om Synthetic Data Open Source-fællesskabet?

Syntetiske data er kun i sine tidlige dage, og af den grund er bevidstheden om, hvordan det genereres, fordelene eller dets begrænsninger stadig noget ukendt for et større publikum. Derfor har vi hos YData besluttet at tage en mere pædagogisk vej ved at skabe Synthetic Data Community – udover at være et sted at udveksle ideer eller få hjælp fra eksperter inden for det syntetiske datafelt, er det også et sted, hvor data scientists og andre teknologiske profiler kan starte deres rejse ind i syntetiske data med nogle af de mest interessante algoritmer fra litteraturen.

Derudover tilbyder vi også et perspektiv på datakvalitet, så dataforskere først kan forstå de data, de arbejder med, før de syntetiserer eller forbedrer datasyntetisering. Vi er virkelig engagerede i at hjælpe datateams med at blive mere og mere datacentrerede.

YData for nylig annonceret 2.7 millioner dollars i finansiering at få fart på sin internationale ekspansion. Kan du dele nogle detaljer om, hvad dette betyder for virksomhedens fremtid og dens ekspansionsstrategi?

YData er allerede født internationalt – vi vidste, at denne form for teknologi har brug for tidlige brugere, som normalt er i de mest sofistikerede lande. Af den grund var vores første kunder allerede uden for Portugal, over hele Europa, og vi er nu også ved at etablere en tilstedeværelse i Nordamerika. Denne finansiering vil give os mulighed for at styrke vores tilstedeværelse på begge disse kontinenter, ikke kun kommercielt, men også for at vokse holdet: Vi er et fuldt distribueret team, som giver os mulighed for at ansætte de bedste talenter, uanset hvor de er.

Er der andet, du gerne vil dele om YData?

YData skubber barrieren for datacentreret AI og skaber en ny kategori: DataPrepOps – selvom det er et grimt navn, er det en smerte, de fleste virksomheder står over for i dag, når det kommer til udvikling af datavidenskab. Datakvalitetstrenden fortsætter med at vokse, og efter Data Pipelines og Data Observability er Data Quality for Data Science-teams stadig i sin vorden, og YData er ved at fremstå som en tankeleder inden for dataforberedelse.

Tak for det gode interview, læsere, der ønsker at lære mere, bør besøge YData.

En stiftende partner af unite.AI og et medlem af Forbes Technology Council, Antoine er en fremtidsforsker der brænder for fremtiden for kunstig intelligens og robotteknologi.

Han er også grundlægger af Værdipapirer.io, en hjemmeside, der fokuserer på at investere i disruptiv teknologi.