taló Fabiana Clemente, cofundadora i directora de dades de YData - Sèrie d'entrevistes - Unite.AI
Connecteu-vos amb nosaltres

entrevistes

Fabiana Clemente, cofundadora i directora de dades de YData – Sèrie d'entrevistes

mm
actualitzat on

Fabiana Clemente és la cofundadora i directora de dades de YData. YData és una startup d'IA que va crear la primera solució de desenvolupament centrada en dades per combinar el descobriment, la millora i l'escala de dades en una única plataforma.

Què et va atraure inicialment de la IA i l'aprenentatge automàtic?

La meva formació és en Matemàtiques Aplicades, on afegeixo l'oportunitat d'aprendre i entendre com podem extreure informació de les dades, així com fer-ho aprofitant el codi. En aquell moment no era tan sexy com l'aprenentatge automàtic, però sens dubte va ser el que va despertar la meva passió per la zona.

Podries compartir la història de la gènesi darrere d'Ydata?

Com a científic de dades que ha treballat tant per a startups com per a empreses, vaig tenir la meva part justa de lluites: de vegades l'accés a les dades es bloquejava sota la premissa de seguretat o privadesa, d'altres vegades l'accés era fàcil, però la qualitat de les dades ni tan sols era. a prop del que es necessitava per construir solucions basades en Ai. Saber que aquestes lluites són molt freqüents a la majoria de les organitzacions, ens va inspirar a iniciar l'empresa amb l'objectiu d'ajudar aquests equips a superar aquests obstacles, accelerant el seu desenvolupament d'IA amb dades millorades.

Podries descriure per al nostre públic què són les dades sintètiques?

Les dades sintètiques es consideren qualsevol dada que no s'ha generat en el món real, per tant, qualsevol dada que es creï artificialment. Hi ha mètodes que permeten la generació de dades sintètiques, des d'estratègies basades en regles fins a l'ús de models d'aprenentatge automàtic o profund per aprendre aquestes "regles" per nosaltres. A YData, vam adoptar i especialitzar-nos en una estratègia basada en l'aprenentatge profund per generar dades noves que mantinguin el comportament dels esdeveniments del món real sense preocupacions per la privadesa.

Què fa que les dades sintètiques siguin tan importants?

Com més organitzacions s'adonin de la importància de les dades per impulsar els seus negocis, més s'entendrà la importància i el paper de les dades sintètiques. Recollir dades reals no només requereix temps i cost, sinó que també, de vegades, és impossible. Per poder crear aplicacions d'IA, les dades són un requisit dur: aquí és on les dades sintètiques vénen al rescat. La capacitat de generar escenaris invisibles o simplement desbloquejar l'accés a les dades, és clau per evolucionar en un món on pioners, com Andrew Ng, afirma que centrar-se en les dades és clau per a una adopció reeixida de la IA.

En els cotxes autònoms o en altres activitats d'automatització de maquinària ja podem percebre la importància de les dades sintètiques, així que diria que és natural que aquesta comprensió s'estengui a totes les verticals de la indústria.

Com genera Ydata dades sintètiques?

YData s'aprofita principalment de models Deep Generative per aprendre els atributs estadístics i les correlacions entre les variables de les dades originals. Això permet que el model generi un conjunt de dades estadísticament rellevant que tingui el mateix valor comercial que l'original, sense permetre la traçabilitat als registres originals.

YData està impulsant aquesta tecnologia i és l'empresa que hi ha darrere Comunitat de dades sintètiques – un grup d'experts en ciència de dades compromesos a evangelitzar i ajudar a tothom que vulgui aprendre i utilitzar aquesta tecnologia.

Com ajuda la plataforma Ydata a descobrir i desbloquejar noves fonts de dades?

La plataforma d'YData inclou connectors integrats a qualsevol tipus de base de dades, magatzem de dades o llac de dades, que permet als usuaris accedir fàcilment a metadades rellevants i entendre si les dades existents són útils per respondre la pregunta empresarial que tenen a mà, sense ni tan sols mirar. als registres reals.

Podries compartir alguns detalls sobre la comunitat de codi obert de dades sintètiques?

Les dades sintètiques són només als seus inicis i per això la consciència de com es genera, els beneficis o les seves limitacions encara són una mica desconegudes per a un públic més ampli. Per això, a YData hem decidit fer una ruta més educativa creant la comunitat Synthetic Data: a més de ser un lloc per intercanviar idees o rebre ajuda d'experts en el camp de les dades sintètiques, també és un lloc on els científics de dades i altres perfils tecnològics poden iniciar el seu viatge cap a les dades sintètiques, amb alguns dels algorismes més interessants de la literatura.

A més, també oferim una perspectiva sobre la qualitat de les dades, de manera que els científics de dades primer puguin entendre les dades amb les quals treballen, abans de sintetitzar o millorar la sintetització de dades. Estem realment compromesos a ajudar els equips de dades a centrar-se cada cop més en les dades.

YData recentment va anunciar 2.7 milions de dòlars en finançament per accelerar la seva expansió internacional. Pots compartir alguns detalls sobre què significa això per al futur de l'empresa i la seva estratègia d'expansió?

YData ja va néixer internacionalment; sabíem que aquest tipus de tecnologia necessita primers usuaris que normalment es troben als països més sofisticats. Per això, els nostres primers clients ja eren fora de Portugal, a tot Europa i ara també estem establint presència a Amèrica del Nord. Aquest finançament ens permetrà reforçar la nostra presència en tots dos continents, no només comercialment, sinó també fer créixer l'equip: som un equip totalment distribuït que ens permet contractar el millor talent, sigui on sigui.

Hi ha alguna cosa més que t'agradaria compartir sobre YData?

YData està empenyent la barrera de la IA centrada en les dades i crea una nova categoria: DataPrepOps, tot i que és un nom lleig, és un dolor al qual s'enfronten la majoria de les empreses avui dia pel que fa al desenvolupament de la ciència de dades. La tendència de la qualitat de les dades continua creixent i, després dels canals de dades i l'observabilitat de dades, la qualitat de les dades per als equips de ciència de dades encara està en els seus inicis i YData s'està convertint en un líder pensat en la preparació de dades.

Gràcies per la gran entrevista, els lectors que vulguin aprendre més haurien de visitar YData.

Soci fundador de unit.AI i membre de la Consell Tecnològic de Forbes, Antoine és un futurista apassionat pel futur de la IA i la robòtica.

També és el fundador de Securities.io, un lloc web que se centra a invertir en tecnologia disruptiva.