στέλεχος Matt Hocking, συνιδρυτής των WellSaid Labs - Σειρά Συνεντεύξεων - Unite.AI
Συνδεθείτε μαζί μας

συνεντεύξεις

Matt Hocking, συνιδρυτής της WellSaid Labs – Σειρά Συνεντεύξεων

mm
Ενημερώθηκε on

Ο Ματ Χόκινγκ είναι ο συνιδρυτής του WellSaid Labs, μια κορυφαία εταιρεία εταιρικής ποιότητας AI Voice Generator. Διαθέτει περισσότερα από 15 χρόνια εμπειρίας στην ηγεσία ομάδων και στην παροχή τεχνολογικών λύσεων σε κλίμακα.

Το υπόβαθρό σας είναι αρκετά επιχειρηματικό, πώς ασχοληθήκατε αρχικά με την τεχνητή νοημοσύνη;

Υποθέτω ότι πάντα θεωρούσα τον εαυτό μου αρκετά επιχειρηματικό. Ξεκίνησα την πρώτη μου επιχείρηση από το κολέγιο και με ένα υπόβαθρο στο σχεδιασμό προϊόντων, βρήκα τον εαυτό μου να ωθεί να βοηθήσω τους ανθρώπους με ιδέες σε αρχικό στάδιο. Σε όλη τη διάρκεια της καριέρας μου, είχα την τύχη να συνεργαστώ με μια σειρά από νεοφυείς επιχειρήσεις που έχουν κάνει μερικές απίστευτες διαδρομές. Κατά τη διάρκεια αυτών των εμπειριών, είχα επαφή με πολλούς σπουδαίους ιδρυτές από πρώτο χέρι, με τη σειρά του να με εμπνέει να ακολουθήσω τις δικές μου ιδέες ως ιδρυτής. Το AI ήταν σχετικά νέο για μένα όταν μπήκα στο AI2. Ωστόσο, αυτή η εμπειρία μου έδωσε την ευκαιρία να εφαρμόσω το προϊόν μου και τον φακό εκκίνησης σε κάποια πραγματικά εκπληκτική έρευνα και να φανταστώ πώς αυτές οι νέες εξελίξεις θα μπορούσαν να βοηθήσουν πολλούς ανθρώπους τα επόμενα χρόνια. Ο στόχος μου από την αρχή ήταν να αναπτύξω πραγματικές επιχειρήσεις για πραγματικούς ανθρώπους και πιστεύω ότι η τεχνητή νοημοσύνη έχει τη δυνατότητα να δημιουργήσει πολλές συναρπαστικές ευκαιρίες και αποτελεσματικότητες στο μέλλον μας, εάν εφαρμοστεί προσεκτικά.

Θα μπορούσατε να μοιραστείτε την ιστορία του πώς δημιουργήθηκε η ιδέα για τα WellSaid Labs όταν ήσασταν επιχειρηματίας στο Το Allen Institute for AI?

Εντάχθηκα στο Allen Institute for Artificial Intelligence (AI2) ως επιχειρηματίας στην κατοικία το 2018. Αναμφισβήτητα η πιο καινοτόμος θερμοκοιτίδα στον κόσμο, η AI2 στεγάζει τα πιο έξυπνα μυαλά στην τεχνητή νοημοσύνη που εφαρμόζουν λύσεις από την άκρη του δυνατού σήμερα σε απτά προϊόντα που λύνουν προβλήματα σε όλο τον κόσμο. Το υπόβαθρό μου στον σχεδιασμό και την τεχνολογία έθρεψε ένα μακροχρόνιο ενδιαφέρον για τους δημιουργικούς τομείς και με την έκρηξη της τεχνητής νοημοσύνης που όλοι παρακολουθούμε σήμερα, ήθελα να εξερευνήσω έναν τρόπο σύνδεσης των δύο. Γνώρισα τον Michael Petrochuk (συνιδρυτής και CTO της WellSaid Labs) ενώ ανέπτυξα μια διαδραστική εφαρμογή υγειονομικής περίθαλψης που καθοδηγούσε τον ασθενή σε διάφορα ευαίσθητα σενάρια. Κατά τη διαδικασία ανάπτυξης του περιεχομένου για την εμπειρία, η ομάδα μου εργάστηκε με ταλέντο φωνής για να ηχογραφήσει εκ των προτέρων χιλιάδες γραμμές φωνής για το avatar. Όταν εκτέθηκα σε μερικές από τις ανακαλύψεις που είχε επιτύχει ο Michael κατά τη διάρκεια της έρευνάς του, γρήγορα είδαμε και οι δύο την αξία του τρόπου με τον οποίο η ανθρώπινη ισοτιμία κειμένου σε ομιλία (TTS) θα μπορούσε να μεταμορφώσει όχι μόνο το προϊόν στο οποίο δούλευα αλλά και να επηρεάσει έναν αριθμό άλλων εφαρμογών και βιομηχανιών. Η τεχνολογία και τα εργαλεία δυσκολεύτηκαν να συμβαδίσουν με τις ανάγκες των παραγωγών που δημιουργούσαν με τη φωνή ως μέσο. Είδαμε έναν δρόμο για να θέσουμε αυτή την τεχνολογία στα χέρια όλων των δημιουργών, επιτρέποντας στη φωνή να αποτελεί αναπόσπαστο μέρος όλων των ιστοριών.

Η WellSaid Labs είναι μια από τις λίγες εταιρείες που παρέχει στους φωνητικούς ηθοποιούς μια λεωφόρο στον χώρο φωνητικής τεχνητής νοημοσύνης. Γιατί πιστεύατε ότι ήταν σημαντικό να ενσωματώσετε πραγματικές φωνές στο προϊόν;

Η απάντησή μας σε αυτό είναι διττή: πρώτον, θέλαμε να δημιουργήσουμε λύσεις που επαινούν τις δυνατότητες των επαγγελματιών φωνητικών ηθοποιών, διευρύνοντας τις ευκαιρίες για φωνή. Και δεύτερον, προσπαθούμε να έχουμε το υψηλότερο επίπεδο ανθρώπινης ποιότητας στα προϊόντα μας. Οι φορείς φωνής μας είναι μακροπρόθεσμοι συνεργάτες και λαμβάνουν αποζημίωση και μερίδιο εσόδων τόσο για τα φωνητικά τους δεδομένα όσο και για το μεταγενέστερο περιεχόμενο που παράγεται με αυτά. Κάθε φωνητικός ηθοποιός που προσλαμβάνουμε για τη δημιουργία ενός avatar φωνής AI με βάση την ομοιότητα της φωνής του πληρώνεται με βάση το πόσο χρησιμοποιείται η φωνή του στην πλατφόρμα μας. Ενθαρρύνουμε τα ταλέντα να συνεργαστούν μαζί μας. Η δίκαιη αποζημίωση για τις συνεισφορές τους είναι απίστευτα σημαντική για εμάς.

Για να προσφέρουμε το υψηλότερο επίπεδο προϊόντων ανθρώπινης ποιότητας στην αγορά, πρέπει να είμαστε αυστηροί σχετικά με το πού λαμβάνουμε τα δεδομένα μας. Αυτή η διαδικασία μας δίνει περισσότερο έλεγχο στην ποιότητα, καθώς εκπαιδεύουμε το δικό μας βαθιά μάθηση μοντέλα που μιλούν τόσο για την ανθρώπινη ισοτιμία όσο και για συγκεκριμένα στυλ που σχετίζονται με τα συμφραζόμενα. Δεν δημιουργούμε απλώς μια φωνή που απαγγέλλει την παρεχόμενη είσοδο. Τα μοντέλα μας προσφέρουν μια ποικιλία από στυλ φωνής που εκτελούν αυτό που υπάρχει στη σελίδα. Είτε οι χρήστες δημιουργούν voiceover χρησιμοποιώντας ένα avatar από τη βιβλιοθήκη μας είτε δημιουργούν voiceover με μια προσαρμοσμένη φωνή για την επωνυμία τους, χρησιμοποιούμε πραγματικά δεδομένα φωνής για να διασφαλίσουμε μια απρόσκοπτη διαδικασία και εύχρηστη πλατφόρμα. Αν οι πελάτες μας έπρεπε να χειραγωγήσουν και να επεξεργαστούν τις φωνές μας στο post-production, η διαδικασία απόκτησης του επιθυμητού αποτελέσματος θα ήταν δύσκολη και μακρά. Οι φωνές μας λαμβάνουν το πλαίσιο του γραπτού περιεχομένου και παρέχουν μια ακριβή ανάγνωση με βάση τα συμφραζόμενα. Προσφέρουμε φωνές για όλους τους τύπους περιπτώσεων χρήσης – είτε πρόκειται για ανάγνωση ειδήσεων, δημιουργία ηχητικής διαφήμισης ή αυτοματοποιημένη υποστήριξη τηλεφωνικού κέντρου – έτσι η συνεργασία με επαγγελματίες φωνητικούς ταλέντους ειδικά για κάθε περίπτωση χρήσης μας παρέχει τόσο το πλαίσιο όσο και τα φωνητικά δεδομένα υψηλής ποιότητας .

Ενημερώνουμε τακτικά και προσθέτουμε νέα στυλ και τόνους στη βιβλιοθήκη avatar μας για να διασφαλίσουμε ότι αντιπροσωπεύουμε τις φωνές των πελατών μας. Στο WellSaid Labs' Studio, οι πελάτες και οι επωνυμίες μπορούν να κάνουν ακρόαση διαφορετικών φωνών με βάση την περιοχή, το στυλ και την περίπτωση χρήσης, επιτρέποντας μια πιο απρόσκοπτη, ενοποιημένη παραγωγή περιεχομένου ήχου εξατομικευμένου στις ανάγκες του κατασκευαστή. Μόλις γίνει δειγματοληψία μιας αρχικής εγγραφής, οι χρήστες μπορούν να υποδείξουν συγκεκριμένες λέξεις, ορθογραφία και προφορές για να εξασφαλίσουν ότι η τεχνητή νοημοσύνη μιλάει με συνέπεια ειδικά για τις ανάγκες τους.

Η WellSaid Labs διακυβεύει τον ισχυρισμό της ως η πρώτη ηθική πλατφόρμα φωνής AI. Γιατί είναι σημαντική για εσάς η ηθική της τεχνητής νοημοσύνης;

Καθώς η υιοθέτηση της τεχνητής νοημοσύνης αυξάνεται και γίνεται πιο mainstream, οι φόβοι για περιπτώσεις επιβλαβούς χρήσης και κακών παραγόντων βρίσκονται στο επίκεντρο κάθε συζήτησης – και αυτές οι ανησυχίες επιβεβαιώνονται δυστυχώς από συμβάντα στον πραγματικό κόσμο. Η φωνή AI δεν αποτελεί εξαίρεση. Σχεδόν κάθε μέρα, μια νέα αναφορά μιας διασημότητας, μιας δημόσιας προσωπικότητας ή ενός πολιτικού που παραποιείται για διαφημίσεις ή πολιτικούς σκοπούς γίνεται πρωτοσέλιδο των ειδήσεων. Αν και ο επίσημος ομοσπονδιακός κανονισμός σχετικά με αυτήν την τεχνολογία εξακολουθεί να εξελίσσεται, ο εντοπισμός και η καταπολέμηση κακόβουλων παραγόντων και χρήσεων συνθετικής φωνής θα γίνεται όλο και πιο δύσκολος καθώς η τεχνολογία συνεχίζει να προοδεύει.

Προερχόμενος από το AI2, όπου η ηθική της AI είναι βασική αρχή, ο Michael και εγώ είχαμε αυτές τις συζητήσεις την πρώτη μέρα. Η ανάπτυξη της τεχνολογίας ομιλίας AI συνοδεύεται από σημαντικές ευθύνες σχετικά με τη συναίνεση, το απόρρητο και τη συνολική ασφάλεια. Γνωρίζουμε ότι εμείς, ως προγραμματιστές, πρέπει να χτίσουμε την τεχνολογία μας με ασφάλεια, να αντιμετωπίσουμε ηθικά ζητήματα και να θέσουμε τις βάσεις για τη μελλοντική ανάπτυξη συνθετικών φωνών. Αναγνωρίζουμε τη δυνατότητα κακής χρήσης της τεχνολογίας ομιλίας AI και αναλαμβάνουμε την ευθύνη μας να μειώσουμε την πιθανή κακή χρήση του προϊόντος μας. Πρέπει να βάλουμε αυτά τα θεμέλια από την πρώτη μέρα αντί να τρέχουμε γρήγορα και να κάνουμε λάθη στην πορεία. Αυτό δεν θα ήταν σωστό από τους εταιρικούς πελάτες μας και τους φωνητικούς φορείς μας, οι οποίοι βασίζονται σε εμάς για να δημιουργήσουμε ένα υψηλής ποιότητας, αξιόπιστο προϊόν.

Υποστηρίζουμε πλήρως την έκκληση για νομοθεσία σε αυτόν τον τομέα. Ωστόσο, δεν θα περιμένουμε τη θέσπιση ομοσπονδιακών κανονισμών. Πάντα δίναμε προτεραιότητα και θα συνεχίσουμε να δίνουμε προτεραιότητα στις πρακτικές που υποστηρίζουν το απόρρητο, την ασφάλεια, τη διαφάνεια και τη λογοδοσία.

Τηρούμε αυστηρά τον ηθικό κώδικα προθέσεων της εταιρείας μας, ο οποίος βασίζεται στην οικοδόμηση με υπεύθυνη καινοτομία σε κάθε απόφαση που λαμβάνουμε. Αυτό είναι προς το καλύτερο συμφέρον των παγκόσμιων πελατών μας – εταιρικών σημάτων.

Πώς αναπτύσσετε μια ηθική πλατφόρμα φωνής AI;

Η WellSaid Labs έχει αφοσιωθεί στην ηθική καινοτομία από την αρχή. Συγκεντρώνουμε την εμπιστοσύνη και τη διαφάνεια μέσω της χρήσης εσωτερικών μοντέλων δεδομένων, των ρητών απαιτήσεων συναίνεσης, του προγράμματος εποπτείας περιεχομένου και της δέσμευσής μας για προστασία της επωνυμίας. Στη WellSaid, βασιζόμαστε στις αρχές του Υπεύθυνη τεχνητή νοημοσύνη να διαμορφώσουμε τις αποφάσεις και τα σχέδιά μας, και αυτές οι αρχές επεκτείνονται στη χρήση της φωνής μας. Ο κώδικας δεοντολογίας μας αντιπροσωπεύει αυτές τις αρχές όπως Υπευθυνότητα, Διαφάνεια, Απόρρητο και Ασφάλεια και Δικαιοσύνη.

Ευθύνη: Διατηρούμε αυστηρά πρότυπα για κατάλληλο περιεχόμενο, απαγορεύοντας τη χρήση της φωνής μας για περιεχόμενο που είναι επιβλαβές, μισητό, δόλιο ή προορίζεται να υποκινήσει τη βία. Η ομάδα Trust & Safety υποστηρίζει αυτά τα πρότυπα με ένα αυστηρό πρόγραμμα εποπτείας περιεχομένου, αποκλείοντας και αφαιρώντας χρήστες που επιχειρούν να παραβιάσουν τους Όρους Παροχής Υπηρεσιών μας.

Διαφάνεια: Απαιτούμε ρητή συναίνεση πριν δημιουργήσουμε μια συνθετική φωνή με τα φωνητικά δεδομένα κάποιου. Οι χρήστες δεν μπορούν να ανεβάσουν φωνητικά δεδομένα από πολιτικούς, διασημότητες ή οποιονδήποτε άλλο για να δημιουργήσουν έναν κλώνο της φωνής τους, εκτός εάν έχουμε τη ρητή, γραπτή συγκατάθεση αυτού του ατόμου.

Απορρήτου και Ασφάλεια: Προστατεύουμε τις ταυτότητες των φωνητικών μας ηθοποιών χρησιμοποιώντας στοκ εικόνες και ψευδώνυμα για την αναπαράσταση των συνθετικών φωνών. Τους ενθαρρύνουμε επίσης να είναι προσεκτικοί σχετικά με το πώς και με ποιον μοιράζονται τη σχέση τους με την WellSaid Labs ή άλλες εταιρείες συνθετικής φωνής για να μειώσουν την πιθανότητα κακής χρήσης της φωνής τους.

Δικαιοσύνη: Αποζημιώνουμε όλους τους φωνητικούς φορείς που παρέχουν φωνητικά δεδομένα για την πλατφόρμα μας και τους παρέχουμε συνεχές μερίδιο εσόδων για τη χρήση της συνθετικής φωνής που δημιουργούμε με τα δεδομένα τους.

Μαζί με αυτές τις αρχές, σεβόμαστε επίσης αυστηρά την πνευματική ιδιοκτησία. Δεν διεκδικούμε την ιδιοκτησία του περιεχομένου που παρέχεται από τους χρήστες ή τους φωνητικούς φορείς μας. Δίνουμε προτεραιότητα στην ακεραιότητα, τη δικαιοσύνη και τη διαφάνεια σε ό,τι κάνουμε, διασφαλίζοντας ότι η τεχνολογία συνθετικής ομιλίας μας χρησιμοποιείται υπεύθυνα και ηθικά. Αναζητούμε ενεργά συνεργασίες με φωνές από διαφορετικά υπόβαθρα και εμπειρίες για να διασφαλίσουμε ότι παρέχουμε φωνή σε όλους.

Η δέσμευσή μας στην υπεύθυνη καινοτομία και στην ανάπτυξη της τεχνολογίας φωνής AI με γνώμονα την ηθική μας ξεχωρίζει από άλλους στον χώρο που επιδιώκουν να επωφεληθούν από μια νέα, ανεξέλεγκτη βιομηχανία με κάθε μέσο. Οι πρώτες επενδύσεις μας στην ηθική, την ασφάλεια και το απόρρητο δημιουργούν εμπιστοσύνη και πίστη στους φωνητικούς παράγοντες και τους πελάτες μας, οι οποίοι αναζητούν όλο και περισσότερο ηθικά προϊόντα και υπηρεσίες από τις εταιρείες που βρίσκονται στην πρώτη γραμμή της καινοτομίας.

Η WellSaid Labs δημιούργησε το δικό της εσωτερικό μοντέλο τεχνητής νοημοσύνης που επέτρεψε στις φωνές της τεχνητής νοημοσύνης να επιτύχουν την ανθρώπινη ισοτιμία και αυτό το πέτυχε φέρνοντας τις ατέλειες που έχουν οι άνθρωποι στις συνομιλίες. Τι είναι αυτό με αυτές τις ατέλειες που κάνουν το AI καλύτερο και πώς υλοποιούνται αυτές οι ατέλειες;

Η WellSaid Labs δεν είναι απλώς μια άλλη γεννήτρια TTS. Όπου η πρώιμη τεχνολογία TTS δεν μπορούσε να αναγνωρίσει ιδιότητες ανθρώπινης ομιλίας, όπως το ύψος, ο τόνος και η διάλεκτος που μεταφέρουν το πλαίσιο και το συναίσθημα πίσω από τις λέξεις, οι φωνές WellSaid έχουν επιτύχει την ανθρώπινη ισοτιμία, φέρνοντας μοναδικές ανθρώπινες ατέλειες στην ομιλία που δημιουργείται από την τεχνητή νοημοσύνη.

Το βασικό μας μέτρο για την ποιότητα της φωνής είναι και ήταν πάντα η ανθρώπινη φυσικότητα. Αυτή η κατευθυντήρια πεποίθηση έχει διαμορφώσει την τεχνολογία μας σε κάθε στάδιο, από τις βιβλιοθήκες σεναρίων που έχουμε δημιουργήσει μέχρι τις οδηγίες που δίνουμε ταλέντο και, πιο πρόσφατα, τον τρόπο με τον οποίο επαναλαμβάνουμε τους βασικούς αλγόριθμους TTS μας.

Εκπαιδευόμαστε σε αυθεντικές ανθρώπινες φωνές. Το ταλέντο της φωνής μας διαβάζει τα σενάρια τους αυθεντικά και ελκυστικά όταν ηχογραφούν για εμάς. Η τελειότητα του λόγου, από την άλλη πλευρά, είναι μια μηχανική έννοια που οδηγεί σε ένα ρομποτικά άψογο, αφύσικο αποτέλεσμα. Όταν τα επαγγελματικά φωνητικά ταλέντο παρουσιάζουν, ο ρυθμός ομιλίας τους κυμαίνεται. Η ένταση τους κινείται σε συνδυασμό με το περιεχόμενο που διαβάζουν. Το φωνητικό τους ύψος μπορεί να ανέβει σε ένα απόσπασμα που απαιτεί μια ενθουσιασμένη ανάγνωση και να πέσει ξανά σε μια πιο ζοφερή γραμμή. Αυτές οι δυναμικές παραλλαγές συνθέτουν μια συναρπαστική ανθρώπινη φωνητική απόδοση.

Χτίζοντας διαδικασίες AI που λειτουργούν σε συντονισμό με τις δυναμικές επιδόσεις του επαγγελματικού μας ταλέντου, έχουμε δημιουργήσει μια πραγματικά φυσική πλατφόρμα TTS. Αναπτύξαμε το πρώτο σύστημα TTS μακράς μορφής με προγνωστικούς ελέγχους σε όλη τη δημιουργική διαδικασία. Η φωνητική βιβλιοθήκη μας διαθέτει μια ποικιλόμορφη συλλογή δεδομένων ήχου, επιτρέποντας στους χρήστες να ενσωματώνουν συγκεκριμένα φωνητικά στοιχεία, όπως καθοδήγηση προφοράς ή δυνατότητα ελέγχου, στο μοντέλο κατά τη φάση παραγωγής. Σε μία πλατφόρμα, οι χρήστες WellSaid μπορούν να ηχογραφήσουν, να επεξεργαστούν και να διαμορφώσουν τη φωνή τους χωρίς να χρειάζεται να εισάγουν εξωτερικά δεδομένα.

Θα μπορούσατε να συζητήσετε μερικές από τις προκλήσεις πίσω από τη δημιουργία μιας εταιρείας τεχνητής νοημοσύνης κειμένου σε ομιλία (TTS);

Η ανάπτυξη της τεχνολογίας φωνής AI έχει δημιουργήσει ένα εντελώς νέο σύνολο εμποδίων τόσο για τους παραγωγούς όσο και για τους καταναλωτές. Μία από τις κύριες προκλήσεις είναι να μην παρασυρθούμε από τον θόρυβο και τη διαφημιστική εκστρατεία που πλημμυρίζει τον τομέα της τεχνητής νοημοσύνης. Ως νέα, πολυσύχναστη τεχνολογία, πολλοί οργανισμοί προσπαθούν να επωφεληθούν από τις βραχυπρόθεσμες εξελίξεις της φωνής της τεχνητής νοημοσύνης. Θέλουμε να παρέχουμε φωνή σε όλους, με γνώμονα τις κεντρικές ηθικές αρχές και την αυθεντικότητα. Αυτή η τήρηση της αυθεντικότητας μπορεί να καθυστερήσει την ανάπτυξη και την ανάπτυξη των τεχνολογιών μας, αλλά ενισχύει την ασφάλεια και την ασφάλεια των φωνών WellSaid και των δεδομένων τους.

Μια άλλη πρόκληση για την ανάπτυξη της πλατφόρμας TTS μας ήταν η ανάπτυξη συγκεκριμένων οδηγιών συναίνεσης για να διασφαλιστεί ότι οι οργανισμοί ή οι μεμονωμένοι παράγοντες δεν θα κάνουν κατάχρηση της τεχνολογίας μας. Για να καταπολεμήσουμε αυτήν την πρόκληση, αναζητούμε συνεργατικές, μακροπρόθεσμες συνεργασίες και συμμετέχουμε πλήρως στην ανάπτυξη φωνής για να αυξήσουμε τη λογοδοσία, τη διαφάνεια και την ασφάλεια των χρηστών. Αναζητούμε ενεργά συνεργασίες με ταλέντα φωνής από διάφορα υπόβαθρα, οργανισμούς και εμπειρίες για να διασφαλίσουμε ότι η βιβλιοθήκη φωνών της WellSaid Labs αντικατοπτρίζει τους δημιουργούς και το κοινό της. Αυτές οι διαδικασίες έχουν σχεδιαστεί για να είναι σκόπιμες και προσανατολισμένες στη λεπτομέρεια για να διασφαλιστεί ότι η τεχνολογία μας χρησιμοποιείται όσο το δυνατόν πιο ασφαλή και ηθικά, γεγονός που μπορεί να επιβραδύνει το χρονοδιάγραμμα ανάπτυξης και κυκλοφορίας.

Ποιο είναι το όραμά σας για το μέλλον των παραγωγικών φωνών AI;

Για το μεγαλύτερο χρονικό διάστημα, η τεχνολογία ομιλίας AI δεν έχει φτάσει σε αρκετά υψηλή ποιότητα ώστε να επιτρέπει στις εταιρείες να δημιουργούν περιεχόμενο με νόημα σε κλίμακα. Τώρα που η τεχνολογία ήχου δεν απαιτεί πλέον ακριβό εξοπλισμό και υλικό, όλο το γραπτό περιεχόμενο μπορεί να παραχθεί και να δημοσιευτεί σε μορφή ήχου για να δημιουργήσει συναρπαστικές, πολυτροπικές εμπειρίες.

Σήμερα, οι φωνές τεχνητής νοημοσύνης μπορούν να παράγουν ήχο σαν τον άνθρωπο και να αποτυπώσουν την απόχρωση που απαιτείται για να γίνει η ψηφιακή αφήγηση πιο προσιτή και φυσική. Το μέλλον της γεννήτριας φωνής AI θα είναι οι ολόπλευρες ακουστικές εμπειρίες που αγγίζουν κάθε πτυχή της ζωής μας. Καθώς η τεχνολογία συνεχίζει να προοδεύει, θα βλέπουμε όλο και πιο φυσικές και εκφραστικές συνθετικές φωνές να θολώνουν τη γραμμή μεταξύ ανθρώπινης και ομιλίας που δημιουργείται από μηχανή – ανοίγοντας νέες πόρτες για επιχειρήσεις, επικοινωνίες, προσβασιμότητα και πώς αλληλεπιδρούμε με τον κόσμο γύρω μας.

Οι επιχειρήσεις θα βρουν βελτιωμένη εξατομίκευση στις φωνητικές διεπαφές AI και θα τις χρησιμοποιήσουν για να κάνουν τις αλληλεπιδράσεις με τους εικονικούς βοηθούς πιο καθηλωτικές και φιλικές προς το χρήστη. Αυτές οι βελτιώσεις συμβαίνουν ήδη, από έξυπνους πράκτορες τηλεφωνικών κέντρων μέχρι ταχυφαγεία. Η δημιουργία περιεχομένου, συμπεριλαμβανομένης της διαφήμισης, του μάρκετινγκ προϊόντων, της αφήγησης ειδήσεων, των podcast, των ακουστικών βιβλίων και άλλων πολυμέσων, θα έχει αυξημένη αποτελεσματικότητα με τη χρήση εργαλείων για την ανάπτυξη ελκυστικού περιεχομένου – αυξάνοντας τελικά την αύξηση και τα έσοδα για τους οργανισμούς, ειδικά τώρα που τα πολύγλωσσα μοντέλα μπορούν να επεκτείνουν την εμβέλεια μιας εταιρείας από ένα μόνο σημείο προέλευσης έως την ύπαρξη παγκόσμιας παρουσίας. Οι ομάδες παραγωγής θα βρουν μεγάλο όφελος στις συνθετικές φωνές για να δημιουργήσουν φωνές προσαρμοσμένες στις ανάγκες της επωνυμίας ή προσαρμοσμένες στον ακροατή.

Πριν από την εισαγωγή του AI, η τεχνολογία TTS δεν είχε τα κρίσιμα ανθρώπινα συναισθήματα, τον τονισμό και τις προφορικές ικανότητες που απαιτούνται για να αφηγηθεί μια πλήρη ιστορία σε κλίμακα και με ευκολία. Τώρα, το TTS με τεχνητή νοημοσύνη προσφέρει πιο καθηλωτικές και προσβάσιμες εμπειρίες, συμπεριλαμβανομένων δυνατοτήτων ομιλίας σε πραγματικό χρόνο και διαδραστικών πρακτόρων συνομιλίας.

Η απόκτηση δυνατοτήτων ομιλίας που μοιάζουν με τον άνθρωπο ήταν ένα ταξίδι, αλλά τώρα που είναι εφικτό, γινόμαστε μάρτυρες του πλήρους εμβέλειας της φωνής AI για τη δημιουργία πραγματικής επιχειρηματικής αξίας για οργανισμούς.

Σας ευχαριστούμε για την υπέροχη συνέντευξη, οι αναγνώστες που επιθυμούν να μάθουν περισσότερα πρέπει να το επισκεφτούν Εργαστήρια WellSaid.

Ιδρυτικός συνεργάτης της unite.AI & μέλος της Τεχνολογικό Συμβούλιο Forbes, Ο Αντουάν είναι α μελλοντιστής που είναι παθιασμένος με το μέλλον της τεχνητής νοημοσύνης και της ρομποτικής.

Είναι επίσης ο Ιδρυτής του Securities.io, ένας ιστότοπος που εστιάζει στην επένδυση σε ανατρεπτική τεχνολογία.