Seguici sui social

Fabiana Clemente, Co-fondatrice e Chief Data Officer di YData – Interview Series

interviste

Fabiana Clemente, Co-fondatrice e Chief Data Officer di YData – Interview Series

mm

Fabiana Clemente è la co-fondatrice e Chief Data Officer di YDati. YData è una startup AI che ha creato la prima soluzione di sviluppo incentrata sui dati per combinare scoperta, miglioramento e scalabilità dei dati in un'unica piattaforma.

Cosa ti ha attratto inizialmente verso l’intelligenza artificiale e l’apprendimento automatico?

Il mio background è in matematica applicata, dove aggiungo l'opportunità di imparare e capire come possiamo estrarre informazioni dai dati oltre a farlo sfruttando il codice. A quel tempo non era così sexy come il Machine Learning, ma è stato sicuramente ciò che ha acceso la mia passione per l'area.

Potresti condividere la storia della genesi di Ydata?

In qualità di Data Scientist che ha lavorato sia per startup che per aziende, ho avuto la mia giusta dose di difficoltà: a volte l'accesso ai dati era bloccato in base alla premessa della sicurezza o della privacy, altre volte l'accesso era facile ma la qualità dei dati non era nemmeno vicino a quanto era necessario per costruire soluzioni basate sull'intelligenza artificiale. Sapendo che queste difficoltà sono molto frequenti nella maggior parte delle organizzazioni, ci ha ispirato ad avviare l'azienda con l'obiettivo di aiutare questi team a superare questi ostacoli, accelerando il loro sviluppo dell'IA con dati migliorati.

Potresti descrivere al nostro pubblico cosa sono i dati sintetici?

I dati sintetici sono considerati tutti i dati che non sono stati generati nel mondo reale, quindi tutti i dati creati artificialmente. Esistono metodi che consentono la generazione di dati sintetici, dalle strategie basate su regole fino all'utilizzo di modelli Machine o Deep Learning per apprendere quelle "regole" per noi. In YData, abbiamo adottato e specializzato in una strategia basata sul Deep Learning per generare nuovi dati che mantengono il comportamento dagli eventi del mondo reale senza preoccupazioni per la privacy.

Cosa rende i dati sintetici così importanti?

Più le organizzazioni si rendono conto dell'importanza dei dati per incrementare le loro attività, più l'importanza e il ruolo dei dati sintetici saranno compresi. La raccolta di dati reali non è solo dispendiosa in termini di tempo e denaro, ma anche, a volte, impossibile. Per essere in grado di creare applicazioni AI, i dati sono un requisito fondamentale: qui è dove i dati sintetici vengono in soccorso. La capacità di generare scenari invisibili o semplicemente sbloccare l'accesso ai dati è la chiave per evolversi in un mondo in cui i pionieri, come Andrew Ng, affermano che diventare incentrati sui dati è la chiave per un'adozione riuscita dell'IA.

Nelle auto a guida autonoma o in altre attività di automazione dei macchinari possiamo già percepire l'importanza dei dati sintetici, quindi direi che è naturale che questa comprensione si diffonda in tutti i settori verticali dell'industria.

In che modo Ydata genera dati sintetici?

YData fa leva principalmente su modelli Deep Generative per apprendere gli attributi statistici e le correlazioni tra le variabili dei dati originali. Ciò consente al modello di generare un set di dati statisticamente rilevante che ha lo stesso valore di business di quello originale, senza consentire la tracciabilità ai record originali.

YData sta spingendo questa tecnologia in avanti ed è la società dietro il Comunità di dati sintetici – un gruppo di esperti di data science impegnati a evangelizzare e aiutare chiunque voglia apprendere e utilizzare questa tecnologia.

In che modo la piattaforma Ydata aiuta a scoprire e sbloccare nuove fonti di dati?

La piattaforma di YData include connettori integrati per qualsiasi tipo di database, data warehouse o data lake, che consentono agli utenti di accedere facilmente ai metadati pertinenti e capire se i dati esistenti sono utili per rispondere alla domanda aziendale che hanno a portata di mano, senza nemmeno guardare ai record reali.

Potresti condividere alcuni dettagli sulla community Open Source di Synthetic Data?

I dati sintetici sono solo agli inizi e per questo motivo la consapevolezza di come vengono generati, i vantaggi o i suoi limiti sono ancora in qualche modo sconosciuti per un pubblico più vasto. Per questo motivo, in YData abbiamo deciso di intraprendere un percorso più educativo creando la comunità dei dati sintetici: oltre ad essere un luogo in cui scambiare idee o ottenere aiuto da esperti nel campo dei dati sintetici, è anche un luogo in cui data scientist e altri profili tecnologici possono iniziare il loro viaggio nei dati sintetici, con alcuni degli algoritmi più interessanti della letteratura.

Inoltre, offriamo anche una prospettiva sulla qualità dei dati, in modo che i data scientist possano prima comprendere i dati con cui stanno lavorando, prima di sintetizzare o migliorare la sintesi dei dati. Ci impegniamo veramente per aiutare i data team a diventare sempre più incentrati sui dati.

YData di recente ha annunciato un finanziamento di 2.7 milioni di dollari per accelerare la sua espansione internazionale. Puoi condividere alcuni dettagli su ciò che questo significa per il futuro dell'azienda e la sua strategia di espansione?

YData è nato già a livello internazionale: sapevamo che questo tipo di tecnologia ha bisogno di utenti precoci che di solito si trovano nei paesi più sofisticati. Per questo motivo, i nostri primi clienti erano già al di fuori del Portogallo, in tutta Europa e ora stiamo stabilendo una presenza anche in Nord America. Questo finanziamento ci consentirà di rafforzare la nostra presenza in entrambi questi continenti, non solo commercialmente, ma anche per far crescere il team: siamo un team completamente distribuito che ci consente di assumere i migliori talenti, ovunque si trovino.

C'è qualcos'altro che vorresti condividere su YData?

YData sta spingendo la barriera dell'intelligenza artificiale incentrata sui dati e creando una nuova categoria: DataPrepOps - sebbene sia un nome brutto, è un dolore che la maggior parte delle aziende deve affrontare al giorno d'oggi quando si tratta di sviluppo della scienza dei dati. La tendenza della qualità dei dati continua a crescere e dopo le pipeline di dati e l'osservabilità dei dati, i team di qualità dei dati per la scienza dei dati sono ancora agli inizi e YData sta emergendo come leader di pensiero nella preparazione dei dati.

Grazie per l'ottima intervista, i lettori che desiderano saperne di più dovrebbero visitare YDati.

Antoine è un leader visionario e socio fondatore di Unite.AI, spinto da una passione incrollabile per la definizione e la promozione del futuro dell'intelligenza artificiale e della robotica. Imprenditore seriale, ritiene che l'intelligenza artificiale sarà dirompente per la società quanto l'elettricità, e spesso viene colto a delirare sul potenziale delle tecnologie dirompenti e dell'AGI.

Come futurista, si dedica a esplorare come queste innovazioni plasmeranno il nostro mondo. Inoltre, è il fondatore di Titoli.io, una piattaforma focalizzata sugli investimenti in tecnologie all'avanguardia che stanno ridefinendo il futuro e rimodellando interi settori.