Connect with us

Δρ. Neil Yager, Συνιδρυτής και Αρχισcientist της Phrasee – Σειρά Συνεντεύξεων

Τεχνητή νοημοσύνη

Δρ. Neil Yager, Συνιδρυτής και Αρχισcientist της Phrasee – Σειρά Συνεντεύξεων

mm

Ο Δρ. Neil Yager είναι ο Αρχισcientist της Phrasee, και ο αρχιτέκτονας της μεθόδου Phrasee, ενός εργαλείου copywriting που βασίζεται σε AI που έχει βοηθήσει να βελτιωθεί η marketing copy για einige από τις πιο αναγνωρισμένες μάρκες του κόσμου, συμπεριλαμβανομένων eBay, Groupon και Virgin – плюς πολλές άλλες, από την Αυστραλία στην Αμερική, σε πάνω από 20 γλώσσες, από τα αγγλικά στα ιαπωνικά.

Ο Δρ. Yager έχει γράψει πάνω από δώδεκα ακαδημαϊκές δημοσιεύσεις, έχει συγγράψει ένα βιβλίο για την εξόρυξη δεδομένων, και κατέχει πολλά πατέντα. Jako ένας από τους κορυφαίους ειδικούς στον κόσμο στην εμπορική εκμετάλλευση της τεχνητής νοημοσύνης, κατέχει διδακτορικό τίτλο στην Επιστήμη των Υπολογιστών από το Πανεπιστήμιο της Νέας Νότιας Ουαλίας στην Αυστραλία.

Είσαι βετεράνος 20 ετών της βιομηχανίας της τεχνολογίας, ποια ήταν κάποια από τα προηγούμενα σου ρόλους που σχετίζονταν με την τεχνητή νοημοσύνη;

Έχω εμπλακεί σε δουλειά που σχετίζεται με την τεχνητή νοημοσύνη από το διδακτορικό μου στις αρχές της δεκαετίας του 2000. Ωστόσο, το πεδίο έχει περάσει από πολλές επανα品牌ώσεις από τότε. Για παράδειγμα, πριν από 15 χρόνια μελετούσα “στατιστική αναγνώριση προτύπων”. Λίγα χρόνια αργότερα αυτό ήταν πιο γνωστό ως “μηχανική μάθηση”, που είναι ένα πολύ πιο ελκυστικό όνομα. Πιο πρόσφατα, η μηχανική μάθηση (και η “βαθιά μάθηση” συγκεκριμένα) έχει γίνει συνώνυμη με την “τεχνητή νοημοσύνη” γενικά. Έχω μικτά συναισθήματα γι’ αυτό. Από τη μια πλευρά, η δουλειά μου με την Phrasee μου taught την σημασία του branding. Από την άλλη πλευρά, ο όρος “τεχνητή νοημοσύνη” φέρνει bagáže μαζί του και μπορεί να οδηγήσει σε λανθασμένες εντυπώσεις για την τεχνολογία. Θαύμασα πού θα ήμασταν αν ακόμα ονομάζαμε όλα αυτά “στατιστική αναγνώριση προτύπων”.

Η περισσότερη από την προηγούμενη δουλειά μου ήταν στα πεδία της επεξεργασίας σήματος και της υπολογιστικής όρασης. Δεν είχα πολύ επαφή με την επεξεργασία φυσικής γλώσσας πριν από την Phrasee. Έχω μάθει ότι η γλώσσα είναι πιθανότατα το πιο δύσκολο πρόβλημα στην τεχνητή νοημοσύνη.

 

Το 2008 συνέγραψες ένα βιβλίο με τίτλο ‘Biometric System and Data Analysis: Design, Evaluation, and Data Mining‘, που συνδυάζει аспекти της στατιστικής και της μηχανικής μάθησης για να παρέχει einen ολοκληρωμένο οδηγό για την αξιολόγηση, την ερμηνεία και την κατανόηση των βιομετρικών δεδομένων. Εκτός από την αύξηση των υπολογιστικών πόρων, πιστεύεις ότι αυτό το πεδίο έχει εξελιχθεί από τότε που δημοσιεύθηκε το βιβλίο; Μπορείς να περιγράψεις πώς;

Η βαθιά μάθηση έχει αναστατώσει τα πεδία της υπολογιστικής όρασης, της επεξεργασίας γλώσσας και της μηχανικής μάθησης από τότε που έγραψα το βιβλίο. Δεν θα ήταν δυνατό να γράψω αυτό το βιβλίο σήμερα χωρίς ένα κεφάλαιο για την βαθιά μάθηση.

Η επανάσταση της βαθιάς μάθησης πραγματοποιήθηκε το 2012, όταν ένα μοντέλο βαθιάς μάθησης κέρδισε einen διαγωνισμό που ονομάζεται ImageNet. Το ImageNet είναι ένα σύνολο δεδομένων αναγνώρισης οπτικών αντικειμένων, όπου ο υπολογιστής καθορίζει τι περιέχεται σε μια εικόνα (π.χ. “σκύλος” ή “μπαλόνι”). Για δεκαετίες, οι ερευνητές είχαν κάνει σταδιακές βελτιώσεις στα σύνολα δεδομένων αναφοράς. Κάθε υποπεδίο λειτουργούσε ανεξάρτητα και βασίζονταν σε μεγάλο βαθμό στην εξειδίκευση του πεδίου. Σχεδόν από τη μια μέρα στην άλλη, όλα τα μοντέλα που είχαν χτιστεί με πολλή δουλειά κατά τη διάρκεια πολλών ετών wurden απαρχαιωμένα. Αλγόριθμοι βαθιάς μάθησης που σχεδιάστηκαν από εξωτερικούς νικητές των διαγωνισμών με σημαντικές διαφορές. Αυτό μετέβαλε την βιομηχανία της τεχνητής νοημοσύνης.

Το πεδίο εξελίσσεται ακόμα και έχει εξελιχθεί ακόμα και από τότε που ξεκινήσαμε την Phrasee πριν από λίγα χρόνια. Για παράδειγμα, τα εργαλεία βαθιάς μάθησης που χρησιμοποιούμε τώρα δεν υπήρχαν όταν ιδρύσαμε την εταιρεία. Το ρυθμός της καινοτομίας φέρνει τις δικές του προκλήσεις.

 

Μπορείς να μοιραστείς μαζί μας τι είναι αυτό που η Phrasee μπορεί να κάνει για τις επιχειρήσεις;

Η Phrasee λύνει δύο προβλήματα για τις επιχειρήσεις. Πρώτον, υπάρχει το πρόβλημα της γραφής marketing copy. Υπάρχουν περισσότερα κανάλια διαφήμισης τώρα παρά ποτέ trước από τώρα (π.χ. email, AdWords, κοινωνικά, έντυπα, podcasts, κ.λπ.). Είναι δύσκολο να γράψεις copy για όλα αυτά που είναι υψηλής ποιότητας και ανταποκρίνεται στο στυλ και τον τόνο της μάρκας. Η Phrasee αντιμετωπίζει το πρόβλημα της κλίμακας αυτόματα γεννώντας copy. Δεύτερον, είναι σημαντικό ότι όλη η γλώσσα που χρησιμοποιείται είναι αποτελεσματική. Όχι μόνο η Phrasee γεννά γλώσσα, αλλά επίσης χρησιμοποιεί μηχανική μάθηση για να προβλέψει την επίδραση του μηνύματος και να το βελτιώσει ανάλογα.

 

Τι ήταν αυτό που σε έκανε να ενδιαφερθείς για την ιδέα της χρήσης της επεξεργασίας φυσικής γλώσσας και της βαθιάς μάθησης για να βελτιώσει τη δύναμη της διαφήμισης;

Η χρήση της τεχνητής νοημοσύνης για να μεγιστοποιήσει την επίδραση των ψηφιακών marketing καμπανιών δεν είναι μια νέα ιδέα. Υπάρχουν ομάδες ανθρώπων με διδακτορικά στη φυσική που έχουν προσληφθεί για να εργαστούν στην βελτιστοποίηση διαφήμισης. Ωστόσο, στις περισσότερες περιπτώσεις, εστιάζουν τις προσπάθειές τους σε πράγματα όπως η διαχωριστική ανάλυση, η προσωποποίηση, ο χρόνος παράδοσης, η τοποθέτηση διαφήμισης, οι γραμματοσειρές, κ.λπ. Όταν αρχίσαμε να σκεφτόμαστε ιδέες για την Phrasee, παρατηρήσαμε ότι σχεδόν όλα για τις διαφημίσεις βελτιστοποιούνται εκτός από τη γλώσσα που χρησιμοποιείται! Ταυτοποιήσαμε αυτό ως ένα κενό στην αγορά και μια τεράστια ευκαιρία.

 

Η Phrasee είναι σε θέση να βελτιώσει το marketing copy σε πάνω από 20 γλώσσες, συμπεριλαμβανομένων των ιαπωνικών. Μπορείς να συζητήσεις κάποια από τα μοναδικά προβλήματα της επεξεργασίας φυσικής γλώσσας που αντιμετωπίζονται με τις ξένες γλώσσες;

Η πιο πρόσφατη προσθήκη στο σύνολο των υποστηριζόμενων γλωσσών μας είναι η ρωσική. Αυτή είναι μια σλαβική γλώσσα και είναι khá διαφορετική από τις άλλες ινδοευρωπαϊκές γλώσσες. Σε αυτή την περίπτωση, ήταν αναγκαίο να χτίσουμε νέες κανόνες στο σύστημα γεννήσεως γλώσσας μας, ώστε η έξοδος να είναι ροή και γραμματικά σωστή. Αυτό δεν είναι μόνο ένα πρόβλημα γλώσσας. Είναι επίσης ένα πρόβλημα ανάπτυξης λογισμικού. Όταν η έξοδος του συστήματός μας είναι στη γλώσσα του προγραμματιστή, είναι σχετικά εύκολο να εντοπίσουμε λάθη και να βεβαιωθούμε ότι όλα λειτουργούν σωστά. Ωστόσο, όταν εργαζόμαστε για τη ρωσική ή την ιαπωνική, μπορούμε να βγάλουμε ανοησίες και να μην το καταλάβουμε. Είναι σημαντικό να έχουμε έναν ομιλητή της γλώσσας να συμμετέχει στενά στη διαδικασία ελέγχου ποιότητας.

Η πρόκληση δεν είναι μόνο με τις ξένες γλώσσες. Υπάρχουν κάποιες ενδιαφέρουσες περιφερειακές διαφορές επίσης. Για παράδειγμα, η αγγλική γλώσσα έχει ποικιλίες ορθογραφίας για τις ΗΠΑ, το Ηνωμένο Βασίλειο, την Αυστραλία, τον Καναδά, κ.λπ. Επιπλέον, υπάρχουν γραμματικές διαφορές. Στην αγγλική γλώσσα του Ηνωμένου Βασιλείου, “έχεις μια ματιά”, ενώ στην αμερικανική αγγλική “πάρεις μια ματιά”. Η σημασία των λέξεων μπορεί επίσης να διαφέρει από τόπο σε τόπο. Ένα “ράντβερ” είναι ένα σφουγγάρι στο Ηνωμένο Βασίλειο, αλλά ένα προφυλακτικό στη Βόρεια Αμερική! Για να χρησιμοποιηθούν τα συστήματα NLG για εμπορικές εφαρμογές, πρέπει να χειριστούν όλες αυτές τις λεπτομέρειες.

 

Μπορείς επίσης να μοιραστείς κάποια λεπτομέρειες σχετικά με τον τρόπο που χρησιμοποιείται η βαθιά μάθηση στην Phrasee;

Υπάρχουν 2 κύρια στοιχεία AI στην τεχνολογία της Phrasee. Το πρώτο είναι η γεννήτρια φυσικής γλώσσας (NLG), η οποία παράγει γλώσσα. Το δεύτερο είναι η βαθιά μάθηση, και εδώ ο στόχος είναι η απόδοση. Η απόδοση μπορεί να σημαίνει διαφορετικά πράγματα ανάλογα με το контέκστ. Για παράδειγμα, ο στόχος ενός θέματος email είναι να πείσει τον παραλήπτη να ανοίξει το email και να δει το περιεχόμενο. Για το Facebook, ο στόχος μπορεί να είναι να μεγιστοποιήσει τις λάικς ή τις κοινοποιήσεις. Μεγάλα όγκοι ιστορικών δεδομένων, είναι δυνατό να βρεθούν λεπτές τάσεις και πρότυπα που δεν θα είχαν ποτέ παρατηρηθεί από έναν άνθρωπο. Αυτό είναι ένα τυπικό πρόβλημα μηχανικής μάθησης.

Η βαθιά μάθηση προσφέρει κάποια πλεονεκτήματα έναντι της παραδοσιακής μηχανικής μάθησης. Με την παραδοσιακή μηχανική μάθηση, υπάρχει μια ισχυρή εστίαση στην “μηχανική χαρακτηριστικών”. Αυτό σημαίνει ότι ο προγραμματιστής πρέπει να αποφασίσει τι πιστεύει ότι είναι τα πιο σημαντικά χαρακτηριστικά της γλώσσας. π.χ. λέξεις, μήκος, χρήση emoji, κ.λπ. Το πρόβλημα είναι ότι αυτό είναι περιορισμένο από τις ικανότητες και την φαντασία του μηχανικού. Ωστόσο, με την βαθιά μάθηση, το сыρό κείμενο τροφοδοτείται στο μοντέλο, και αυτό χτίζει τη δική του αναπαράσταση της γλώσσας (αυτό ονομάζεται end-to-end μάθηση). Έτσι, είναι ελεύθερο από ανθρώπινη προκατάληψη και είναι μια ισχυρή προσέγγιση. Ωστόσο, το μειονέκτημα είναι ότι μπορεί να είναι δύσκολο να κατανοηθεί γιατί το μοντέλο συμπεριφέρεται με τον τρόπο που το κάνει. “Εξήγηση” είναι ένα ενεργό πεδίο έρευνας στην κοινότητα της βαθιάς μάθησης. Ωστόσο, υπάρχει một θεμελιώδης ανταλλαγή μεταξύ της πολυπλοκότητας eines συστήματος και της ικανότητάς μας να το κατανοήσουμε. Η ανθρώπινη γλώσσα είναι ακατάστατη, οπότε οι επιτυχείς λύσεις NLP τυπικά έχουν υψηλό βαθμό πολυπλοκότητας.

 

Μια από τις λειτουργίες της Phrasee είναι η δυνατότητα να γράφει σε ένα μοναδικό τόνο μάρκας, μπορώ να επεκταθώ σε αυτό;

Όταν υπογράψουμε einen νέο πελάτη, το πρώτο που κάνουμε είναι να συλλέξουμε πληροφορίες σχετικά με το στυλ επικοινωνίας της μάρκας. Αυτό περιλαμβάνει οποιαδήποτε επίσημα οδηγίες μάρκας, ιστορικές marketing καμπάνιες και μια σειρά ερωτηματολογίων που έχουμε αναπτύξει για αυτόν τον σκοπό. Όλες αυτές οι πληροφορίες χρησιμοποιούνται από μια εσωτερική ομάδα γλωσσικών τεχνικών για να χτίσουν einen πελάτη-ειδικό “μοντέλο γλώσσας”. Τα μοντέλα γλώσσας μας είναι γεννητικά, που σημαίνει ότι μπορούν να παράγουν nunca-seen-πριν γλώσσα στο μοναδικό στυλ του πελάτη.

Τα μοντέλα γλώσσας μπορούν να ενημερωθούν ανά πάσα στιγμή. Για παράδειγμα, αυτή τη στιγμή βρισκόμαστε στο αποκορύφωμα της κρίσης COVID-19. Η ομάδα γλώσσας μας αναθεωρεί τα μοντέλα μας για να βεβαιωθούμε ότι δεν μπορεί να δημιουργηθεί ακατάλληλη γλώσσα. Μια φράση όπως “Αυτές οι προσφορές είναι ιογενείς!” μπορεί να ήταν αθώα πριν από quelques μήνες, αλλά είναι σαφώς ακατάλληλη στη μέση μιας παγκόσμιας πανδημίας. Αυτό δείχνει την ευελιξία του συστήματός μας.

 

Τι είδους δεδομένα χρειάζεται μια εταιρεία που θέλει να ξεκινήσει με την Phrasee;

Για να είμαι ειλικρινής, δεν χρειάζονται πολλά δεδομένα για να ξεκινήσετε με εμάς. Το πρώτο βήμα είναι να पहचανθεί ένας κατάλληλος χώρος έργου. Για παράδειγμα, αυτό μπορεί να είναι τα θέματα email για τις εβδομαδιαίες προωθητικές email. Ιδανικά, αυτό θα είχε μια σχετικά μεγάλη ακροαματική και τα μηνύματα θα ήταν τακτά. Μόλις έχει पहचανθεί το έργο, χρειαζόμαστε πληροφορίες σχετικά με το προτεινόμενο θέμα και τη φωνή μάρκας για να χτίσουμε το μοντέλο γλώσσας. Η Phrasee χρειάζεται αποτελέσματα απόδοσης σε συνεχείς βάσεις.既然 η λύση μας χρησιμοποιεί μηχανική μάθηση, είναι σημαντικό να μετράμε και να παρακολουθούμε κλειδιά μετρήσεις με τον καιρό. Αυτές οι πληροφορίες τροφοδοτούνται πίσω στο σύστημά μας, ώστε να μπορεί να συνεχίσει να βελτιστοποιεί για συμμετοχή.

 

Υπάρχει κάτι άλλο που θα ήθελες να μοιραστείς σχετικά με την Phrasee;

Όταν ο Parry, η Victoria και εγώ ξεκινήσαμε την Phrasee πριν από πέντε χρόνια, ήμασταν σίγουροι ότι θα ήταν μόνο θέμα χρόνου πριν πολλές άλλες startups με παρόμοια προϊόντα. Ο στόχος μας ήταν να πάρουμε einen αέρα από την ανταγωνιστική αγορά και να μείνουμε έναν βήμα μπροστά. Ωστόσο, μας έχει εκπλήξει η έλλειψη συμμετεχόντων σε αυτό το χώρο. Πού είναι όλοι οι άλλοι; Νομίζω ότι υπάρχουν quelques λόγοι για αυτό, αλλά ένας από τους κύριους είναι ότι η γλώσσα είναι τόσο δύσκολο πρόβλημα. Υποψιάζομαι ότι άλλοι έχουν προσπαθήσει να δημιουργήσουν παρόμοια προϊόντα, αλλά απέτυχαν νωρίς στα στάδια R&D. Αυτό είναι ένα τεστAMENT στην μοναδικότητα της τεχνολογίας μας.

Ευχαριστώ για τη συνέντευξη σχετικά με την επεξεργασία φυσικής γλώσσας, την γεννήτρια φυσικής γλώσσας και τη βαθιά μάθηση. Για να μάθετε περισσότερα, οι επισκέπτες possono επισκεφθεί Phrasee.

Ο Antoine είναι ένας οραματιστής ηγέτης και συνιδρυτής του Unite.AI, οδηγείται από μια αμετάβλητη страсть για το σχήμα και την προώθηση του μέλλοντος του AI και της ρομποτικής. Ένας σειριακός επιχειρηματίας, πιστεύει ότι το AI θα είναι τόσο διαταρακτικό για την κοινωνία όσο η ηλεκτρική ενέργεια, και συχνά πιάνεται να μιλάει για το δυναμικό των διαταρακτικών τεχνολογιών και του AGI.

Ως futurist, είναι αφοσιωμένος στο να εξερευνήσει πώς αυτές οι καινοτομίες θα σχήματίσουν τον κόσμο μας. Επιπλέον, είναι ο ιδρυτής του Securities.io, μια πλατφόρμα που επικεντρώνεται στις επενδύσεις σε τεχνολογίες που αναedefinουν το μέλλον και ανασχήματίσουν ολόκληρους τομείς.