στέλεχος Το AI μπορεί να αποφύγει συγκεκριμένες ανεπιθύμητες συμπεριφορές με νέους αλγόριθμους - Unite.AI
Συνδεθείτε μαζί μας

Τεχνητή νοημοσύνη

Το AI μπορεί να αποφύγει συγκεκριμένες ανεπιθύμητες συμπεριφορές με νέους αλγόριθμους

mm

Δημοσιευμένα

 on

Καθώς οι αλγόριθμοι και τα συστήματα τεχνητής νοημοσύνης γίνονται πιο εξελιγμένα και αναλαμβάνουν μεγαλύτερες ευθύνες, γίνεται όλο και πιο σημαντικό να διασφαλίζεται ότι τα συστήματα τεχνητής νοημοσύνης αποφεύγουν την επικίνδυνη, ανεπιθύμητη συμπεριφορά. Πρόσφατα μια ομάδα ερευνητών από το Πανεπιστήμιο της Μασαχουσέτης Amherst και Stanford δημοσίευσε ένα έγγραφο που δείχνει πώς μπορεί να αποφευχθεί συγκεκριμένη συμπεριφορά τεχνητής νοημοσύνης, μέσω της χρήσης μιας τεχνικής που αποσπά ακριβείς μαθηματικές οδηγίες που μπορούν να χρησιμοποιηθούν για να τροποποιήσουν τη συμπεριφορά ενός AI.

Σύμφωνα με το TechXplore, η έρευνα βασίστηκε στην υπόθεση ότι οι αθέμιτες/ανασφαλείς συμπεριφορές μπορούν να οριστούν με μαθηματικές συναρτήσεις και μεταβλητές. Εάν αυτό είναι αλήθεια, τότε θα πρέπει να είναι δυνατό για τους ερευνητές να εκπαιδεύσουν συστήματα ώστε να αποφεύγουν αυτές τις συγκεκριμένες συμπεριφορές. Η ερευνητική ομάδα είχε ως στόχο να αναπτύξει μια εργαλειοθήκη που θα μπορούσε να χρησιμοποιηθεί από τους χρήστες της τεχνητής νοημοσύνης για να καθορίσει ποιες συμπεριφορές θέλουν να αποφύγει η τεχνητή νοημοσύνη και να επιτρέψει στους μηχανικούς της τεχνητής νοημοσύνης να εκπαιδεύσουν αξιόπιστα ένα σύστημα που θα αποφεύγει ανεπιθύμητες ενέργειες όταν χρησιμοποιείται σε σενάρια πραγματικού κόσμου.

Ο Phillip Thomas, ο πρώτος συγγραφέας του χαρτιού και βοηθός καθηγητής επιστήμης υπολογιστών στο U of Michigan Amherst, εξήγησε ότι η ερευνητική ομάδα στοχεύει να αποδείξει ότι οι σχεδιαστές αλγορίθμων μηχανικής μάθησης μπορούν να διευκολύνουν τους χρήστες τεχνητής νοημοσύνης να περιγράψουν ανεπιθύμητες συμπεριφορές και να είναι εξαιρετικά πιθανόν ότι το σύστημα AI θα αποφύγει τη συμπεριφορά.

Η ερευνητική ομάδα δοκίμασε την τεχνική της εφαρμόζοντάς την σε ένα κοινό πρόβλημα στην επιστήμη των δεδομένων, την προκατάληψη του φύλου. Η ερευνητική ομάδα είχε ως στόχο να κάνει τους αλγόριθμους που χρησιμοποιούνται για την πρόβλεψη της ΣΔΣ των φοιτητών κολεγίου πιο δίκαιοι, μειώνοντας την προκατάληψη του φύλου. Η ερευνητική ομάδα χρησιμοποίησε ένα πειραματικό σύνολο δεδομένων και έδωσε εντολή στο σύστημα τεχνητής νοημοσύνης να αποφύγει τη δημιουργία μοντέλων που γενικά υποτίμησαν/υπερεκτιμούσαν τις ΣΔΣ για ένα φύλο. Ως αποτέλεσμα των οδηγιών του ερευνητή, ο αλγόριθμος δημιούργησε ένα μοντέλο που προέβλεπε καλύτερα τις GPA των μαθητών και είχε σημαντικά λιγότερη συστημική προκατάληψη για το φύλο από τα προηγούμενα μοντέλα. Τα προηγούμενα μοντέλα πρόβλεψης GPA υπέφεραν από προκατάληψη επειδή τα μοντέλα μείωσης προκατάληψης ήταν συχνά πολύ περιορισμένα για να είναι χρήσιμα ή δεν χρησιμοποιήθηκε καθόλου μείωση μεροληψίας.

Ένας διαφορετικός αλγόριθμος αναπτύχθηκε επίσης από την ερευνητική ομάδα. Αυτός ο αλγόριθμος εφαρμόστηκε σε μια αυτοματοποιημένη αντλία ινσουλίνης και ο αλγόριθμος είχε σκοπό να εξισορροπήσει τόσο την απόδοση όσο και την ασφάλεια. Οι αυτοματοποιημένες αντλίες ινσουλίνης πρέπει να αποφασίσουν πόσο μεγάλη δόση ινσουλίνης θα πρέπει να χορηγηθεί στον ασθενή Μετά το φαγητό, η αντλία θα χορηγήσει ιδανικά μια δόση ινσουλίνης τόσο μεγάλη ώστε να διατηρεί υπό έλεγχο τα επίπεδα σακχάρου στο αίμα. Οι δόσεις ινσουλίνης που χορηγούνται δεν πρέπει να είναι ούτε πολύ μεγάλες ούτε πολύ μικρές.

Οι αλγόριθμοι μηχανικής μάθησης είναι ήδη ικανοί στον εντοπισμό μοτίβων στην απόκριση ενός ατόμου στις δόσεις ινσουλίνης, αλλά αυτές οι υπάρχουσες μέθοδοι ανάλυσης δεν μπορούν να επιτρέψουν στους γιατρούς να καθορίσουν αποτελέσματα που πρέπει να αποφεύγονται, όπως κρίσεις χαμηλού σακχάρου στο αίμα. Αντίθετα, η ερευνητική ομάδα μπόρεσε να αναπτύξει μια μέθοδο που θα μπορούσε να εκπαιδευτεί ώστε να παρέχει δόσεις ινσουλίνης που παραμένουν στα δύο άκρα, αποτρέποντας είτε την υποδοσολογία είτε την υπερδοσολογία. Ενώ, το σύστημα δεν είναι ακόμα έτοιμο για δοκιμή σε πραγματικούς ασθενείς, μια πιο εξελιγμένη τεχνητή νοημοσύνη βασισμένη σε αυτήν την προσέγγιση θα μπορούσε να βελτιώσει την ποιότητα ζωής για όσους πάσχουν από διαβήτη.

Στην ερευνητική εργασία, οι ερευνητές αναφέρονται στον αλγόριθμο ως αλγόριθμο «Σελεδόνια». Αυτό αναφέρεται στους τρεις νόμους της ρομποτικής που περιγράφονται από τον συγγραφέα Sci-Fi Isaac Asimov. Το συμπέρασμα είναι ότι το σύστημα τεχνητής νοημοσύνης «δεν μπορεί να τραυματίσει έναν άνθρωπο ή, μέσω αδράνειας, να επιτρέψει σε έναν άνθρωπο να πληγεί». Η ερευνητική ομάδα ελπίζει ότι το πλαίσιο της θα επιτρέψει σε ερευνητές και μηχανικούς τεχνητής νοημοσύνης να δημιουργήσουν μια ποικιλία αλγορίθμων και συστημάτων που αποφεύγουν την επικίνδυνη συμπεριφορά. Emma Brunskill, ανώτερη συγγραφέας της εργασίας και επίκουρη καθηγήτρια επιστήμης υπολογιστών στο Stanford, εξηγείται στο TechXplore:

«Θέλουμε να προωθήσουμε την τεχνητή νοημοσύνη που σέβεται τις αξίες των ανθρώπινων χρηστών της και δικαιολογεί την εμπιστοσύνη που έχουμε στα αυτόνομα συστήματα».

Blogger και προγραμματιστής με ειδικότητες στο Μηχανική μάθηση και Βαθιά μάθηση Θέματα. Ο Daniel ελπίζει να βοηθήσει άλλους να χρησιμοποιήσουν τη δύναμη της τεχνητής νοημοσύνης για κοινωνικό καλό.