Suivez nous sur

Tyler Weitzman, co-fondateur et responsable de l'IA chez Speechify - Série d'interviews

Interviews

Tyler Weitzman, co-fondateur et responsable de l'IA chez Speechify - Série d'interviews

mm

Tyler Weitzman est co-fondateur, responsable de l'intelligence artificielle et prĂ©sident de Speechify, l'application de synthèse vocale n°1 au monde, totalisant plus de 100,000 5 avis 50 Ă©toiles. Weitzman est diplĂ´mĂ© de l'UniversitĂ© de Stanford, oĂą il a obtenu un BS en mathĂ©matiques et une maĂ®trise en informatique dans le domaine de l'intelligence artificielle. Il a Ă©tĂ© sĂ©lectionnĂ© par Inc. Magazine comme l'un des XNUMX meilleurs entrepreneurs, et il a Ă©tĂ© prĂ©sentĂ© dans Business Insider, TechCrunch, LifeHacker, CBS, entre autres publications. La recherche de maĂ®trise de Weitzman s'est concentrĂ©e sur l'intelligence artificielle et la synthèse vocale, oĂą son article final Ă©tait intitulĂ© : "CloneBot : prĂ©dictions personnalisĂ©es de rĂ©ponse au dialogue".

Vous avez commencé à coder alors que vous n'aviez que 9 ans, qu'est-ce qui vous a initialement attiré vers l'informatique ?

J'étais assez obsédé quand j'étais enfant avec Dragon Ball Z, et je voulais apprendre à m'animer. J'ai appris Adobe Flash et Photoshop et mis mes propres animations de Goku sur une page Web de fans que j'ai construite. C'est peu de temps après que j'ai commencé à apprendre les systèmes et les algorithmes, et quand j'ai appris que je pouvais réellement programmer pour gagner ma vie, c'était assez excitant. Je pensais que c'était juste un passe-temps comme jouer à des jeux.

Vous avez ensuite commencĂ© Ă  crĂ©er des applications iPhone alors que vous n'aviez que 12 ans, quelles Ă©taient certaines de ces applications ?

Une application appelée Black SMS permet aux utilisateurs de s'envoyer des messages texte cryptés. Une autre application appelée Frontback permet aux utilisateurs de prendre des selfies et des photos de ce qui se trouve devant eux exactement au même moment.

Pourriez-vous parler de vos recherches à l’Université de Stanford et de la manière dont elles étaient centrées sur le traitement du langage naturel et la synthèse vocale ?

Mes recherches couvraient de multiples utilisations des réseaux de transformateurs, y compris des modèles de génération de langage pour le chat, le marquage des parties du discours, la prédiction de ponctuation et la synthèse vocale. L'optimisation de l'inférence du réseau neuronal pour les processeurs mobiles était un objectif principal et cela s'est directement traduit par les voix hors ligne disponibles sur Speechify, qui fonctionnent même en mode avion.

Pourriez-vous partager l'histoire de la genèse de Speechify ?

Je suis aveugle d'un œil et mon frère Cliff est dyslexique. Nous avons utilisé des livres audio et la technologie audio de synthèse vocale depuis aussi longtemps que nous nous souvenons de l'école et quand nous étions jeunes pour lire des livres comme Harry Potter. En vieillissant et en commençant à utiliser davantage de produits technologiques, nous avons commencé à réaliser qu'il était possible de créer de meilleures applications de synthèse vocale sur le Web et sur mobile avec de meilleures voix grâce aux progrès de l'IA et à une meilleure expérience utilisateur. Nous avons donc décidé de nous lancer dans Speechify.

Quelles sont certaines des diffĂ©rentes technologies d’apprentissage automatique utilisĂ©es chez Speechify ?

Nous avons adopté des techniques de pointe pour les architectures génératives avancées : transformateurs/conformateurs, préformation à grande échelle, formation distribuée, accumulation de gradient, espaces latents encodés automatiquement, diffusion, réseaux contradictoires et modélisation du langage. Nous utilisons des techniques de support pour le traitement des caractéristiques entourant la phonémisation, la hauteur et l'émotion, afin de mieux modéliser spécifiquement la parole.

Quels sont certains des dĂ©fis liĂ©s Ă  la crĂ©ation d'une application de synthèse vocale ?

L'un des principaux défis consiste à construire voix de haute qualité qui ressemblent à de vrais humains plutôt qu'à des robots. Notre objectif est que les gens ne puissent pas faire la différence entre le son de nos voix et le son des humains, afin que nos utilisateurs soient à l'aise pour écouter du contenu sur Speechify pendant de longues périodes. Un deuxième défi consiste à distribuer nos modèles d'IA à des millions d'utilisateurs. C'est une chose de créer des voix d'IA de haute qualité et une autre de s'assurer que des millions d'utilisateurs à travers le monde les découvrent et les utilisent.

Speechify est l'application n°1 de sa catégorie sur l'App Store, à quoi attribuez-vous ce succès ?

Nous pensons avoir conçu les meilleurs produits du marché pour les personnes qui souhaitent écouter la lecture dont elles ont besoin, qu'il s'agisse d'étudiants ayant des devoirs, de professionnels qui lisent pour le travail ou de lecteurs de loisir qui veulent simplement se divertir. Nous avons la meilleure sélection de voix, y compris des célébrités comme Snoop Dogg, et la meilleure interface utilisateur pour que les gens téléchargent et accèdent facilement au contenu qu'ils veulent consommer. Et notre expérience utilisateur est transparente dans tout l'écosystème Speechify - vous pouvez commencer à écouter un article sur votre ordinateur puis zappez-le facilement pour garder écouter sur votre téléphone.

Quels sont les principaux cas d'utilisation de cette application ?

Speechify IA générative résout de vrais problèmes pour les étudiants qui veulent faire beaucoup de devoirs plus rapidement, les vraies personnes atteintes de dyslexie et de TDAH qui ont du mal à lire, les personnes âgées malvoyantes, les professionnels qui veulent lire plus et être plus productifs, les écrivains qui veulent écouter leur travail , les apprenants auditifs et d'innombrables autres.

Quelle est votre vision du futur de l'IA ?

Nous voulons l'IA - et plus particulièrement Voix de synthèse vocale par IA – pour éliminer les obstacles à l'apprentissage, quels que soient votre niveau de revenu, vos différences d'apprentissage, votre situation géographique ou votre langue. Nous considérons l'IA comme un outil de bien social pour élever la qualité de vie que les humains peuvent vivre en améliorant leur éducation.

Merci pour cette excellente interview, les lecteurs qui souhaitent en savoir plus devraient visiter Speechify.

Antoine est un leader visionnaire et partenaire fondateur d'Unite.AI, animé par une passion inébranlable pour façonner et promouvoir l'avenir de l'IA et de la robotique. Entrepreneur en série, il croit que l'IA sera aussi perturbatrice pour la société que l'électricité, et on le surprend souvent en train de s'extasier sur le potentiel des technologies disruptives et de l'AGI.

En futuriste, il se consacre à l'exploration de la manière dont ces innovations façonneront notre monde. En outre, il est le fondateur de Titres.io, une plateforme axée sur l’investissement dans les technologies de pointe qui redéfinissent l’avenir et remodèlent des secteurs entiers.