Intelligence artificielle

Technologie d’essaim acoustique innovante qui façonne l’avenir de l’audio en salle

mm

Dans une avancée révolutionnaire, une équipe de chercheurs de l’Université de Washington a introduit un système avancé de contrôle du son qui promet de redéfinir la dynamique de l’audio en salle. La technologie unique, similaire à un essaim de robots, utilise des microphones auto-déployants pour séparer les salles en zones de discours distinctes.

Cette technologie pionnière crée un réseau d’entités robotiques petites qui se dispersent sur diverses surfaces, émettant des sons à haute fréquence similaires à la navigation des chauves-souris pour éviter les obstacles et se distribuer pour un contrôle du son optimal et une isolation de la voix. Ce système, grâce à un déploiement sophistiqué, dépasse les limites des enceintes intelligentes grand public existantes et permet une différenciation et une localisation améliorées des conversations simultanées.

Malek Itani, un étudiant doctorant de l’UW et co-auteur principal de l’étude étude, a souligné les capacités sans précédent de cet essaim acoustique, déclarant : “Pour la première fois, en utilisant ce que nous appelons un essaim robotique ‘acoustique’, nous sommes capables de suivre les positions de plusieurs personnes qui parlent dans une salle et de séparer leur discours.”

Répondre aux défis du monde réel

Alors que les outils de réunions virtuelles actuels permettent de contrôler qui peut parler, la gestion des conversations en salle dans des environnements réels, en particulier dans des environnements bondés, présente de nombreux défis. Cette technologie innovante parvient à isoler des voix spécifiques et à séparer des discussions simultanées, même parmi des individus ayant des tons de voix similaires, sans avoir besoin de signaux visuels ou de caméras. Cela marque un progrès considérable dans la gestion de l’audio dans des espaces comme les salons, les cuisines et les bureaux, où discerner plusieurs voix est crucial.

Le système a démontré une efficacité impeccable, discernant différentes voix à l’intérieur de 1,6 pieds les unes des autres 90 % du temps dans des environnements variés. “Nous avons développé des réseaux de neurones qui utilisent ces signaux retardés pour séparer ce que chaque personne dit et suivre leur position dans un espace”, a noté le co-auteur principal Tuochao Chen. Il a également clarifié que cela permet d’isoler et de localiser chaque voix dans une salle où plusieurs conversations se déroulent simultanément.

Améliorer la confidentialité et le contrôle

Les chercheurs envisagent l’application de cette technologie dans les maisons intelligentes, offrant aux utilisateurs un contrôle amélioré de l’audio en salle et des interactions avec les enceintes intelligentes. Le système promet une expérience raffinée, permettant la création de zones actives, où seuls les individus dans des zones spécifiques peuvent interagir verbalement avec les appareils. Cela constitue un pas important vers la matérialisation de concepts de la science-fiction, présentant des possibilités de création de zones muettes et actives réelles.

Cependant, avec l’innovation vient la responsabilité, et les chercheurs sont profondément conscients des implications de confidentialité de cette technologie. Ils ont institué des garanties, notamment des lumières visibles sur les robots actifs et un traitement local de toutes les données audio, pour assurer la confidentialité des utilisateurs.

“Elle a le potentiel de bénéficier réellement à la confidentialité”, a affirmé Itani.

Le système offre la possibilité de créer des bulles de confidentialité et des zones de silence, garantissant que les conversations restent privées et non enregistrées en fonction des préférences de l’utilisateur, servant ainsi d’outil pour améliorer la confidentialité au-delà de ce que permettent les enceintes intelligentes actuelles.

Cette invention des chercheurs de l’Université de Washington marque un tournant crucial dans la technologie acoustique, fusionnant l’innovation robotique et le contrôle du son sophistiqué pour résoudre des défis du monde réel. Elle ne promet pas seulement une expérience utilisateur améliorée et un contrôle, mais elle ouvre également une nouvelle ère de confidentialité et de personnalisation dans les interactions audio en salle.

L’intégration de ce système dans des environnements quotidiens pourrait redéfinir nos interactions avec les appareils intelligents et notre approche de la confidentialité, rendant les concepts autrefois fictifs une partie de notre vie quotidienne. Les possibilités profondes et les considérations éthiques de ces progrès soulignent la nécessité d’une exploration continue et d’une mise en œuvre responsable des technologies innovantes.

Alex McFarland est un journaliste et écrivain en intelligence artificielle qui explore les derniers développements en intelligence artificielle. Il a collaboré avec de nombreuses startups et publications en intelligence artificielle dans le monde entier.