Intelligenza artificiale
Unity Lancia Dataset Sintetici per Ridurre il Tempo e i Budget di Addestramento dell’AI

Unity, una piattaforma leader per il contenuto 3D in tempo reale (RT3D), ha annunciato il rilascio di Unity Computer Vision Datasets. Questi dataset potrebbero avere un impatto su vari settori, in particolare manifattura, retail e sicurezza. Sono finalizzati a ridurre i costi di sviluppo delle applicazioni di visione artificiale e a fornire un modo per addestrare i sistemi AI più velocemente.
Seguendo rigorosi criteri di privacy e normative, i dataset personalizzati possono ora essere acquistati dai fornitori di soluzioni di visione artificiale per addestrare i sistemi AI.
Importanza dei Dati Sintetici
I dati sintetici vengono generati quando i dati esistenti non soddisfano le condizioni o le esigenze specifiche di un sistema AI. Alcuni esempi includono quando i requisiti di privacy limitano i dati disponibili o il loro utilizzo.
I dati sintetici vengono spesso utilizzati per testare un prodotto prima del rilascio, poiché di solito non esistono dati esistenti o non sono ancora disponibili. Questo tipo di dati è anche cruciale per gli algoritmi di apprendimento automatico e viene spesso utilizzato in tecnologie come i veicoli autonomi, poiché ottenere dati reali è costoso.
Unity sta cercando di superare questa barriera fornendo un accesso più ampio a dataset sintetici di alta qualità con i Unity Computer Vision Datasets.
Il Dr. Danny Lange è Senior Vice President di Intelligenza Artificiale e Apprendimento Automatico.
“Creando una versione sintetica dei dataset che rispecchiano le regole di privacy validate e riflettono accuratamente i dati del mondo reale, consentiamo a questi dataset innovativi di arrivare nelle mani di più innovatori”, afferma Lange.
“In sostanza, questi dataset consentono alle aziende di pianificare e simulare scenari che non hanno ancora sperimentato, con un aumento significativo dei dati utente che mimano ciò che si troverebbero nel mondo reale nel tempo. Di conseguenza, stiamo vedendo ambienti interni più intelligenti, come negozi di generi alimentari senza cassiere, e molti altri, poiché i nostri clienti scoprono nuove applicazioni”.
https://www.youtube.com/watch?v=Cz7KWqAgZAw
Domain Randomization
La tecnica utilizzata dai dataset di visione artificiale di Unity si chiama “domain randomization”, che aiuta a sviluppare dataset diversi che migliorano la qualità e controllano i pregiudizi. Funziona producendo permutazioni della posizione e dell’orientamento degli oggetti, comprese le variazioni di luce, gli angoli della camera e le possibili configurazioni.
I dataset sintetici di Unity evitano anche i problemi legati ai pregiudizi a causa dell’utilizzo di immagini di persone e luoghi reali da Internet, o immagini catturate manualmente.
L’annotazione di solito aumenta di prezzo quanto più complesso è il tipo di annotazione, ma Unity offre un prezzo unico per qualsiasi tipo di etichetta, il che significa che lo stesso prezzo sarà pagato per etichette semplici e complesse secondo gli standard dell’industria. I dataset sono basati su un modello di prezzi a livelli, con il prezzo per immagine che diminuisce in base all’aumento della necessità di più immagini sintetiche.
“I dati sintetici stanno rivoluzionando l’addestramento dei modelli di apprendimento automatico, poiché superano molti dei limiti dei dati del mondo reale raccolti e etichettati manualmente”, ha affermato Lange.
“Spiegare cosa è possibile e mettere in contatto i creatori con i dati accessibili di cui hanno bisogno per prendere le decisioni giuste continua a guidare Unity, indipendentemente dal settore. È per questo che il nostro team sarà disponibile per assistere i clienti nell’assicurarsi che i dataset prodotti soddisfino i criteri giusti per le loro esigenze”.












