στέλεχος Ερευνητές αναπτύσσουν αλγόριθμους που στοχεύουν στην πρόληψη της κακής συμπεριφοράς στην τεχνητή νοημοσύνη - Unite.AI
Συνδεθείτε μαζί μας

Ηθική

Ερευνητές αναπτύσσουν αλγόριθμους που στοχεύουν στην πρόληψη της κακής συμπεριφοράς στην τεχνητή νοημοσύνη

mm
Ενημερώθηκε on

Μαζί με όλες τις προόδους και τα πλεονεκτήματα που έχει παρουσιάσει η τεχνητή νοημοσύνη μέχρι στιγμής, υπήρξαν επίσης αναφορές για ανεπιθύμητες παρενέργειες όπως η φυλετική και έμφυλη προκατάληψη στην τεχνητή νοημοσύνη. Ετσι ώστε sciencealert.com θέτει το ερώτημα "πώς μπορούν οι επιστήμονες να διασφαλίσουν ότι τα προηγμένα συστήματα σκέψης μπορούν να είναι δίκαια ή ακόμα και ασφαλή;».

Η απάντηση μπορεί να είναι η έκθεση των ερευνητών στο Stanford και το Πανεπιστήμιο της Μασαχουσέτης Amherst, Με τίτλο Πρόληψη ανεπιθύμητης συμπεριφοράς έξυπνων μηχανών. Ως eurekaalert.org σημειώνει στην ιστορία της για αυτήν την έκθεση, η τεχνητή νοημοσύνη αρχίζει τώρα να χειρίζεται ευαίσθητες εργασίες, επομένως «οι υπεύθυνοι χάραξης πολιτικής επιμένουν ότι οι επιστήμονες υπολογιστών προσφέρουν διαβεβαιώσεις ότι τα αυτοματοποιημένα συστήματα έχουν σχεδιαστεί για να ελαχιστοποιούν, αν όχι εντελώς, τα ανεπιθύμητα αποτελέσματα, όπως ο υπερβολικός κίνδυνος ή ο φυλετικός διάκριση λόγω φύλου."

Η έκθεση που παρουσίασε αυτή η ομάδα ερευνητών «περιγράφει μια νέα τεχνική που μεταφράζει έναν ασαφή στόχο, όπως η αποφυγή της προκατάληψης του φύλου, στα ακριβή μαθηματικά κριτήρια που θα επέτρεπαν σε έναν αλγόριθμο μηχανικής μάθησης να εκπαιδεύσει μια εφαρμογή τεχνητής νοημοσύνης για να αποφύγει αυτή τη συμπεριφορά».

Σκοπός ήταν, όπως Η Emma Brunskill, επίκουρη καθηγήτρια επιστήμης υπολογιστών στο Stanford και ανώτερη συγγραφέας της εργασίας επισημαίνει «θέλουμε να προωθήσουμε την τεχνητή νοημοσύνη που σέβεται τις αξίες των ανθρώπινων χρηστών της και δικαιολογεί την εμπιστοσύνη που έχουμε στα αυτόνομα συστήματα».

Η ιδέα ήταν να ορίσουμε «μη ασφαλή» ή «άδικα» αποτελέσματα ή συμπεριφορές με μαθηματικούς όρους. Αυτό, σύμφωνα με τους ερευνητές, θα καθιστούσε δυνατή «τη δημιουργία αλγορίθμων που μπορούν να μάθουν από δεδομένα για το πώς να αποφύγουν αυτά τα ανεπιθύμητα αποτελέσματα με υψηλή σιγουριά».

Ο δεύτερος στόχος ήταν να «αναπτύξτε ένα σύνολο τεχνικών που θα διευκόλυνε τους χρήστες να προσδιορίσουν τι είδους ανεπιθύμητη συμπεριφορά θέλουν να περιορίσουν και να επιτρέψουν στους σχεδιαστές μηχανικής μάθησης να προβλέψουν με σιγουριά ότι ένα σύστημα που έχει εκπαιδευτεί χρησιμοποιώντας δεδομένα του παρελθόντος μπορεί να βασιστεί όταν εφαρμόζεται σε πραγματικό παγκόσμιες συνθήκες».

Το ScienceAlert λέει ότι η ομάδα ονόμασε αυτό το νέο σύστημα  Αλγόριθμοι 'Seldonian', μετά τον κεντρικό χαρακτήρα του διάσημου Isaac Asimov Θεμέλιο σειρά μυθιστορημάτων επιστημονικής φαντασίας. ΠΧίλιπ Τόμας, επίκουρος καθηγητής επιστήμης υπολογιστών στο Πανεπιστήμιο της Μασαχουσέτης Άμχερστ και πρώτος συγγραφέας των σημειώσεων της εργασίας, «Αν χρησιμοποιήσω έναν αλγόριθμο Seldonian για διαβήτης θεραπεία, μπορώ να προσδιορίσω ότι ανεπιθύμητη συμπεριφορά σημαίνει επικίνδυνα χαμηλά επίπεδα σακχάρου στο αίμα ή υπογλυκαιμία». 

«Μπορώ να πω στο μηχάνημα: "Ενώ προσπαθείτε να βελτιώσετε τον ελεγκτή στην αντλία ινσουλίνης, μην κάνετε αλλαγές που θα αύξαναν τη συχνότητα της υπογλυκαιμίας." Οι περισσότεροι αλγόριθμοι δεν σας δίνουν έναν τρόπο να βάλετε αυτόν τον τύπο περιορισμού στη συμπεριφορά. δεν περιλαμβανόταν στα πρώτα σχέδια».

Ο Θωμάς προσθέτει ότι «αυτό το πλαίσιο Seldonian θα διευκολύνει τους σχεδιαστές μηχανικής μάθησης να δημιουργήσουν οδηγίες αποφυγής συμπεριφοράς σε όλα τα είδη αλγορίθμων, με τρόπο που θα τους επιτρέψει να εκτιμήσουν την πιθανότητα τα εκπαιδευμένα συστήματα να λειτουργήσουν σωστά στον πραγματικό κόσμο.

Από την πλευρά της, η Emma Brunskill σημειώνει επίσης ότι «Το να σκεφτόμαστε πώς μπορούμε να δημιουργήσουμε αλγόριθμους που σέβονται καλύτερα τις αξίες όπως η ασφάλεια και η δικαιοσύνη είναι απαραίτητη καθώς η κοινωνία βασίζεται όλο και περισσότερο στην τεχνητή νοημοσύνη».

Πρώην διπλωμάτης και μεταφραστής του ΟΗΕ, επί του παρόντος ανεξάρτητος δημοσιογράφος/συγγραφέας/ερευνητής, με έμφαση στη σύγχρονη τεχνολογία, την τεχνητή νοημοσύνη και τον σύγχρονο πολιτισμό.