Τεχνητή νοημοσύνη
Προβολή της αλλαγής του κλίματος σε φωτογραφίες με τα δίκτυα αντιπάλου που δημιουργούνται
Μια ομάδα ερευνητών από τον Καναδά και τις ΗΠΑ ανέπτυξε μια μέθοδο μηχανικής μάθησης για να επικαλύψει τις καταστροφικές επιπτώσεις της κλιματικής αλλαγής σε πραγματικές φωτογραφίες χρησιμοποιώντας Generative Adversarial Networks (GANs), με στόχο τη μείωση της «αποστασιοποίησης» αδυναμία σχέσης σε υποθετικά ή αφηρημένα σενάρια σχετικά με την κλιματική αλλαγή.
Η σχέδιο, Με τίτλο ClimateGAN, αποτελεί μέρος μιας ευρύτερης ερευνητικής προσπάθειας για την ανάπτυξη διαδραστικών περιβαλλόντων όπου οι χρήστες μπορούν να εξερευνήσουν προβαλλόμενους κόσμους που έχουν επηρεαστεί από πλημμύρες, υπερβολική ζέστη και άλλες σοβαρές συνέπειες της κλιματικής αλλαγής.
Συζητώντας το κίνητρο πίσω από την πρωτοβουλία, οι ερευνητές αναφέρουν:
«Η κλιματική αλλαγή αποτελεί μείζονα απειλή για την ανθρωπότητα και οι ενέργειες που απαιτούνται για την πρόληψη των καταστροφικών συνεπειών της περιλαμβάνουν αλλαγές τόσο στη χάραξη πολιτικής όσο και στην ατομική συμπεριφορά. Ωστόσο, η ανάληψη δράσης απαιτεί την κατανόηση των επιπτώσεων της κλιματικής αλλαγής, παρόλο που μπορεί να φαίνονται αφηρημένες και απόμακρες.
«Η προβολή των πιθανών συνεπειών ακραίων κλιματικών γεγονότων, όπως οι πλημμύρες σε οικεία μέρη, μπορεί να βοηθήσει να γίνουν πιο συγκεκριμένες οι αφηρημένες επιπτώσεις της κλιματικής αλλαγής και να ενθαρρύνει τη δράση».
Βασικός στόχος της πρωτοβουλίας είναι να ενεργοποιήσει ένα σύστημα όπου ένας χρήστης μπορεί να εισαγάγει τη διεύθυνσή του (ή οποιαδήποτε διεύθυνση) και να δει μια εκδοχή της αντίστοιχης εικόνας που επηρεάζεται από την κλιματική αλλαγή από το Google Street View. Ωστόσο, οι αλγόριθμοι μετασχηματισμού πίσω από το ClimateGAN απαιτούν κάποια εκτιμώμενη γνώση του ύψους για τα στοιχεία της φωτογραφίας, τα οποία δεν περιλαμβάνονται στα μεταδεδομένα που παρέχει η Google για το Street View, και έτσι η απόκτηση μιας τέτοιας εκτίμησης αλγοριθμικά παραμένει μια διαρκής πρόκληση.
Δεδομένα και Αρχιτεκτονική
Το ClimateGAN χρησιμοποιεί έναν αγωγό μετάφρασης εικόνας σε εικόνα χωρίς επίβλεψη με δύο φάσεις: ένα στρώμα Masker, το οποίο υπολογίζει πού θα υπήρχε θεωρητικά μια επίπεδη επιφάνεια νερού στην εικόνα στόχο. και μια ενότητα Painter για να αποδίδει ρεαλιστικά το νερό εντός των ορίων της καθιερωμένης μάσκας και λαμβάνει υπόψη την ανακλαστικότητα της υπόλοιπης μη ασαφούς γεωμετρίας πάνω από την ίσαλο γραμμή.
Τα περισσότερα από τα δεδομένα εκπαίδευσης επιλέχθηκαν από το CityScapes και Μύτιλος σύνολα δεδομένων. Ωστόσο, δεδομένου ότι τα υπάρχοντα δεδομένα για εικόνες πλημμύρας είναι σχετικά σπάνια, οι ερευνητές συνδύασαν τα υπάρχοντα διαθέσιμα σύνολα δεδομένων με έναν νέο «εικονικό κόσμο» που αναπτύχθηκε με τη μηχανή παιχνιδιών Unity3D.
Ο κόσμος Unity3D περιέχει περίπου 1.5 χιλιόμετρο εδάφους και περιλαμβάνει αστικές, προαστιακές και αγροτικές περιοχές, τις οποίες «πλημμύρισαν» οι ερευνητές. Αυτό επέτρεψε τη δημιουργία εικόνων «πριν» και «μετά» για πρόσθετη βασική αλήθεια για το πλαίσιο ClimateGAN.
Η μονάδα Masker προσαρμόζει το 2018 ΕΛΕΥΣΗ κώδικα για εκπαίδευση, προσθέτοντας πρόσθετα δεδομένα σύμφωνα με τα ευρήματα του 2019 από τη γαλλική ερευνητική πρωτοβουλία DADA. Οι ερευνητές πρόσθεσαν επίσης έναν αποκωδικοποιητή τμηματοποίησης για να τροφοδοτήσει τη μονάδα Masker πρόσθετες πληροφορίες σχετικά με τη σημασιολογία της εικόνας εισόδου (δηλ. πληροφορίες με ετικέτα που υποδηλώνουν έναν τομέα, όπως «κτίριο»).
Ο αποκωδικοποιητής μάσκας Flood υπολογίζει μια εφικτή ίσαλο γραμμή και τροφοδοτείται από το εξαιρετικά δημοφιλές της NVIDIA ΦΤΥΑΡΙ πλαίσιο ζωγραφικής.
Αν και οι ερευνητές χρησιμοποίησαν NVIDIA GauGAN, που υποστηρίζεται από το SPADE, για τη μονάδα Painter, ήταν απαραίτητο να ρυθμιστεί το GauGAN στην έξοδο του Masker και όχι σε έναν γενικευμένο σημασιολογικό χάρτη τμηματοποίησης, όπως συμβαίνει στην κανονική χρήση, καθώς οι εικόνες έπρεπε να μετασχηματιστούν σύμφωνα με την ίσαλο γραμμή οριοθετήσεις, αντί να υπόκεινται σε ευρείς, γενικούς μετασχηματισμούς.
Αξιολόγηση Ποιότητας
Οι μετρήσεις για την αξιολόγηση της ποιότητας των εικόνων που προέκυψαν διευκολύνθηκαν με την επισήμανση ενός δοκιμαστικού συνόλου 180 εικόνων Google Street View διαφόρων τύπων, συμπεριλαμβανομένων αστικών σκηνών και περισσότερων αγροτικών εικόνων από διάφορες γεωγραφικές τοποθεσίες. Οι εικόνες επισημάνθηκαν χειροκίνητα ως δεν μπορεί να πλημμυρίσει, πρέπει να πλημμυρίσει, να μπορεί να πλημμυρίσει.
Αυτό επέτρεψε τη διατύπωση τριών μετρήσεων: ποσοστό σφάλματος (αντιληπτές περιοχές πρόβλεψης κατά μέγεθος στη μετασχηματισμένη εικόνα), F05 Σκορ, να συνοχή άκρων. Για σύγκριση, οι ερευνητές εξέτασαν τα δεδομένα σε προηγούμενα μοντέλα μετάφρασης εικόνας σε εικόνα (IIT), συμπεριλαμβανομένων InstaGAN, CycleGAN, να MUNIT.
Οι ερευνητές παραδέχονται ότι η έλλειψη δεδομένων ύψους στις εικόνες πηγής καθιστά δύσκολη την αυθαίρετη επιβολή υψών ίσαλου γραμμής στις εικόνες, εάν ο χρήστης θέλει να καλέσει λίγο τον «παράγοντα Roland Emmerich». Παραδέχονται επίσης ότι οι επιπτώσεις της πλημμύρας περιορίζονται υπερβολικά στην περιοχή της πλημμύρας και σκοπεύουν να διερευνήσουν μεθόδους με τις οποίες θα μπορούσαν να προστεθούν στη μεθοδολογία πολλαπλά επίπεδα πλημμύρας (δηλαδή μετά την ύφεση ενός αρχικού κατακλυσμού).
Ο κωδικός του ClimateGAN ήταν διατίθεται στο GitHub, μαζί με πρόσθετα παραδείγματα αποδομένων εικόνων.