Etica
I ricercatori si rivolgono ai neuroscienziati per superare il bias dei dataset

Un team di ricercatori al MIT, all’Università di Harvard e alla Fujitsu, Ltd. ha cercato di capire come un modello di machine learning potesse superare il bias dei dataset. Hanno fatto affidamento su un approccio di neuroscienze per studiare come i dati di training influenzano la capacità di una rete neurale artificiale di riconoscere oggetti che non ha mai visto.
La ricerca è stata pubblicata in Nature Machine Intelligence.
Diversità nei dati di training
I risultati dello studio hanno dimostrato che la diversità nei dati di training influenza la capacità di una rete neurale di superare il bias. Tuttavia, la diversità dei dati può anche avere un impatto negativo sulle prestazioni della rete. I ricercatori hanno anche mostrato che il modo in cui una rete neurale viene addestrata può anche influenzare la sua capacità di superare un dataset distorto.
Xavier Boix è un ricercatore nel Dipartimento di Scienze del Cervello e delle Scienze Cognitive (BCS) e nel Centro per i Cervelli, le Menti e le Macchine (CBMM). È anche autore senior del paper.
“Una rete neurale può superare il bias dei dataset, il che è incoraggiante. Ma il punto principale qui è che dobbiamo tenere conto della diversità dei dati. Dobbiamo smettere di pensare che se si raccoglie solo una grande quantità di dati grezzi, questo ci porterà da qualche parte. Dobbiamo essere molto cauti su come progettiamo i dataset fin dall’inizio”, afferma Boix.
Il team ha adottato la mentalità di un neuroscienziato per sviluppare il nuovo approccio. Secondo Boix, è comune utilizzare dataset controllati negli esperimenti, quindi il team ha costruito dataset che contenevano immagini di oggetti diversi in varie pose. Hanno poi controllato le combinazioni in modo che alcuni dataset fossero più diversi di altri. Un dataset con più immagini che mostrano oggetti da un solo punto di vista è meno diverso, mentre uno con più immagini che mostrano oggetti da più punti di vista è più diverso.
I ricercatori hanno preso questi dataset e li hanno utilizzati per addestrare una rete neurale per la classificazione delle immagini. Hanno poi studiato quanto fosse brava a identificare oggetti da punti di vista che la rete non aveva visto durante l’addestramento.
Hanno scoperto che i dataset più diversi consentono alla rete di generalizzare meglio le nuove immagini o i punti di vista, e questo è cruciale per superare il bias.
“Ma non è come se più diversità dei dati sia sempre meglio; c’è una tensione qui. Quando la rete neurale diventa migliore nel riconoscere nuove cose che non ha visto, allora diventerà più difficile per essa riconoscere le cose che ha già visto”, afferma Boix.
Metodi per l’addestramento delle reti neurali
Il team ha anche scoperto che un modello addestrato separatamente per ogni task è in grado di superare il bias meglio di un modello addestrato per entrambi i task insieme.
“I risultati sono stati veramente sorprendenti. In effetti, la prima volta che abbiamo fatto questo esperimento, abbiamo pensato che fosse un bug. Ci sono volute diverse settimane per renderci conto che era un risultato reale perché era così inaspettato”, continua Boix.
Un’analisi più approfondita ha rivelato che la specializzazione dei neuroni è coinvolta in questo processo. Quando la rete neurale viene addestrata per riconoscere oggetti nelle immagini, emergono due tipi di neuroni. Un neurone si specializza nel riconoscere la categoria dell’oggetto, mentre l’altro si specializza nel riconoscere il punto di vista.
I neuroni specializzati diventano più prominenti quando la rete viene addestrata per eseguire task separate. Tuttavia, quando una rete viene addestrata per completare entrambi i task contemporaneamente, alcuni neuroni diventano diluiti. Ciò significa che non si specializzano in un task e sono più propensi a confondersi.
“Ma la prossima domanda adesso è, come sono arrivati questi neuroni? Si addestra la rete neurale e emergono dal processo di apprendimento. Nessuno ha detto alla rete di includere questi tipi di neuroni nella sua architettura. È la cosa più affascinante”, afferma Boix.
I ricercatori cercheranno di esplorare questa domanda nel loro lavoro futuro, nonché di applicare il nuovo approccio a task più complessi.












