Intelligence artificielle
Création d'images satellite à partir de cartes vectorielles
Des chercheurs britanniques ont développé un système de synthèse d'images basé sur l'IA qui peut convertir à la volée des cartes vectorielles en images de type satellite.
L'architecture neuronale s'appelle Synthèse transparente d'images satellites (SSS), et offre la perspective d'environnements virtuels réalistes et de solutions de navigation qui ont une meilleure résolution que l'imagerie satellite peut offrir ; sont plus à jour (puisque les systèmes de cartes cartographiques peuvent être mis à jour en direct); et peut faciliter des vues réalistes de style orbital dans les zones où la résolution du capteur satellite est limitée ou autrement indisponible.
Pour démontrer la puissance du système, les chercheurs ont créé un environnement interactif de style Google Earth où le spectateur peut zoomer et observer les images satellite générées à une variété d'échelles de rendu et de détails, les tuiles se mettant à jour en direct de la même manière. manière que les systèmes interactifs conventionnels pour l'imagerie satellitaire :
De plus, comme le système peut générer des images de type satellite à partir de n'importe quelle carte vectorielle, il pourrait en théorie être utilisé pour construire des mondes historiques, projetés ou fictifs, à intégrer dans des simulateurs de vol et des environnements virtuels. De plus, les chercheurs prévoient de synthétiser des environnements virtuels entièrement en 3D à partir de données cartographiques à l'aide de transformateurs.
À plus court terme, les auteurs pensent que leur cadre pourrait être utilisé pour un certain nombre d'applications réelles, y compris la planification urbaine interactive et la modélisation procédurale, envisageant un scénario dans lequel les parties prenantes peuvent éditer une carte de manière interactive et voir des images à vol d'oiseau de le terrain projeté en quelques secondes.
Le nouveau système d’ papier vient de deux chercheurs de l'Université de Leeds, et est intitulé Synthèse transparente d'images satellites.
Architecture et données de formation source
Le nouveau système utilise le 2017 de l'UCL Berkeley Pix2Pix et ceux de NVIDIA BÊCHE architecture de synthèse d'images. Le cadre contient deux nouveaux réseaux de neurones convolutifs - carte2sat, qui effectue la conversion d'images vectorielles en images basées sur des pixels ; et couture2cont, qui calcule non seulement une méthode transparente pour rassembler les tuiles 256 × 256, mais fournit également un environnement d'exploration interactif.
Le système apprend à synthétiser les vues satellites en s'entraînant sur les vues vectorielles et leurs équivalents satellitaires réels, formant une compréhension généralisée de la façon d'interpréter les facettes vectorielles en interprétations photo-réelles.
Les images vectorielles utilisées dans le jeu de données sont pixellisées à partir de fichiers GeoPackage (.geo) qui contiennent jusqu'à 13 étiquettes de classe, telles que suivre, environnement naturel, bâtiment et les routières, qui sont exploités pour décider du type d'imagerie à insérer dans la vue satellite.
Les images satellite .geo tramées conservent également les métadonnées locales du système de référence de coordonnées, qui sont utilisées pour les interpréter dans leur contexte dans le cadre cartographique plus large et pour permettre à l'utilisateur de naviguer de manière interactive dans les cartes créées.
Tuiles sans soudure sous contraintes strictes
La création d'environnements cartographiques explorables est un défi, car les limitations matérielles du projet limitent les tuiles à une taille de seulement 256 x 256 pixels. Par conséquent, il est important que le processus de rendu ou de composition tienne compte de la "vue d'ensemble", au lieu de se concentrer exclusivement sur la tuile à portée de main, ce qui conduirait à des juxtapositions discordantes lorsque les tuiles sont assemblées, avec des routes changeant soudainement de couleur et d'autres non -artefacts de rendu réalistes.
Par conséquent, SSS utilise une hiérarchie échelle-espace de réseaux de générateurs pour générer une variation de contenu à diverses échelles, et le système est capable d'évaluer arbitrairement les tuiles à n'importe quelle échelle intermédiaire dont le spectateur pourrait avoir besoin.
La section seam2cont de l'architecture utilise deux couches superposées et indépendantes de la sortie map2sat, et calcule une bordure appropriée dans le contexte de l'image plus large à représenter :
Le réseau map2sat est une adaptation optimisée d'un réseau SPADE à part entière, exclusivement formé à 256×256 pixels. Les auteurs notent qu'il s'agit d'une implémentation légère et rapide, conduisant à des poids de seulement 31.5 Mo contre 436.9 Mo dans un réseau SPADE complet.
3000 images satellites réelles ont été utilisées pour former les deux sous-réseaux sur 70 époques de temps de formation ; toutes les images contiennent des informations sémantiques équivalentes (c'est-à-dire une compréhension conceptuelle de bas niveau des objets représentés tels que les « routes ») et des métadonnées de positionnement basées sur la géolocalisation.
D'autres documents sont disponibles sur la page du projet, ainsi qu'une vidéo d'accompagnement (intégrée ci-dessous).