Intelligenza artificiale
Ridimensionamento di immagini ad alta risoluzione con apprendimento automatico

Nuove ricerche condotte nel Regno Unito hanno proposto un metodo di apprendimento automatico migliorato per ridimensionare le immagini, basato sul valore percepito delle varie parti del contenuto dell’immagine, invece di ridurre indiscriminatamente la dimensione (e quindi la qualità e le caratteristiche estraibili) per tutti i pixel dell’immagine.
Come parte di un crescente interesse per i sistemi di compressione guidati dall’intelligenza artificiale, si tratta di un approccio che potrebbe eventualmente informare nuovi codec per la compressione di immagini in generale, sebbene il lavoro sia motivato dall’imaging sanitario, dove il campionamento arbitrario di immagini mediche ad alta risoluzione potrebbe portare alla perdita di informazioni vitali.

Architettura rappresentativa del nuovo sistema. Il modulo di deformazione interstiziale produce una mappa di deformazione che corrisponde alle aree di interesse nell’immagine. La densità e la direzione dei punti rossi indicano queste aree. La mappa viene utilizzata non solo per il campionamento, ma anche per ricostruire le aree di interesse principale quando il contenuto dell’immagine viene ri-scalato non uniformemente dall’altra parte del processo di formazione. Source: https://arxiv.org/pdf/2109.11071.pdf
Il sistema applica segmentazione semantica alle immagini – ampi blocchi, rappresentati come blocchi di colore nell’immagine sopra, che racchiudono entità riconosciute all’interno dell’immagine, come ‘strada’, ‘bicicletta’, ‘lesione’, ecc. La disposizione delle mappe di segmentazione semantica viene utilizzata per calcolare quali parti della foto non dovrebbero essere eccessivamente campionate.
Intitolato Apprendimento del campionamento per la segmentazione di immagini ad ultra-alta risoluzione, il nuovo articolo è una collaborazione tra ricercatori del Centre for Medical Image Computing dell’University College London e ricercatori del dipartimento Healthcare Intelligence di Microsoft Cambridge.
Il mondo a bassa risoluzione (piuttosto) dell’addestramento della visione artificiale
L’addestramento dei sistemi di visione artificiale è significativamente limitato dalla capacità delle GPU. I set di dati possono contenere molte migliaia di immagini da cui estrarre caratteristiche, ma anche le GPU di portata industriale tendono a raggiungere un picco di 24 GB di VRAM, con carenze in corso che influiscono sulla disponibilità e sul costo.
Ciò significa che i dati devono essere inviati attraverso i core di tensori limitati della GPU in lotti gestibili, con 8-16 immagini tipiche di molti flussi di lavoro di addestramento della visione artificiale.












