заглушки Инновационная технология Acoustic Swarm формирует будущее аудиосистемы в помещениях - Unite.AI
Свяжитесь с нами:

Artificial Intelligence

Инновационная технология Acoustic Swarm формирует будущее аудиосистемы в помещениях

опубликованный

 on

Изображение: Вашингтонский университет

В рамках новаторской разработки группа исследователей из Вашингтонского университета представила усовершенствованную систему управления звуком, которая обещает пересмотреть динамику звука в помещении. Уникальная технология, подобная рою роботов, использует саморазвертывающиеся микрофоны для разделения комнат на отдельные речевые зоны.

Эта новаторская технология создает сеть небольших роботизированных объектов, которые рассредоточиваются по различным поверхностям, издавая высокочастотные звуки, похожие на звуки навигации летучей мыши, чтобы избегать препятствий и распределяться для оптимального управления звуком и изоляции голоса. Эта система, благодаря сложному развертыванию, превосходит ограничения существующих потребительских интеллектуальных колонок и позволяет повысить дифференциацию и локализацию одновременных разговоров.

Малек Итани, аспирант Университета Вашингтона и соавтор книги исследование, подчеркнул беспрецедентные возможности этого акустического роя, заявив: «Впервые, используя то, что мы называем роботизированным «акустическим роем», мы можем отслеживать позиции нескольких людей, говорящих в комнате, и разделять их речь. ».

Решение реальных проблем

В то время как современные инструменты виртуальных встреч позволяют контролировать, кто будет говорить, управление разговорами в комнате в реальных условиях, особенно в многолюдных местах, представляет собой множество проблем. Эта инновационная технология позволяет изолировать отдельные голоса и разделять одновременные дискуссии даже между людьми с похожим тоном голоса без необходимости использования визуальных подсказок или камер. Это знаменует собой значительный шаг вперед в управлении звуком в таких помещениях, как гостиные, кухни и офисы, где различение нескольких голосов имеет решающее значение.

Система продемонстрировала безупречную эффективность, распознавая разные голоса в радиусе 1.6 фута друг от друга в 90% случаев в различных условиях. «Мы разработали нейронные сети, которые используют эти сигналы с задержкой по времени, чтобы отделять то, что говорит каждый человек, и отслеживать его положение в пространстве», — отметил соавтор Туочао Чен. Он также пояснил, что это позволяет изолировать и определить местоположение каждого голоса в комнате, где одновременно происходит несколько разговоров.

Меняющие форму умные колонки создают речевые зоны

Повышение конфиденциальности и контроля

Исследователи предполагают применение этой технологии в умных домах, предлагая пользователям расширенный контроль над звуком в комнате и взаимодействием с интеллектуальными динамиками. Система обещает усовершенствованный опыт, позволяющий создавать активные зоны, в которых только люди в определенных областях могут голосово взаимодействовать с устройствами. Это станет важным шагом на пути к материализации концепций научной фантастики, предоставляя возможности создания реальных немых и активных зон.

Однако с инновациями приходит ответственность, и исследователи глубоко осознают последствия таких технологий для конфиденциальности. Они ввели меры безопасности, включая видимую подсветку активных роботов и локальную обработку всех аудиоданных, обеспечивая конфиденциальность пользователей.

«Это потенциально может принести пользу конфиденциальности», — заявил Итани.

Система предлагает возможность создавать зоны конфиденциальности и зоны отключения звука, гарантируя, что разговоры останутся конфиденциальными и незаписанными в зависимости от предпочтений пользователя, тем самым выступая в качестве инструмента для повышения конфиденциальности за пределами того, что позволяют современные интеллектуальные колонки.

Это изобретение исследователей из Вашингтонского университета знаменует собой поворотный момент в акустических технологиях, объединяющих инновационную робототехнику и сложное управление звуком для решения реальных задач. Он не только обещает улучшенный пользовательский опыт и контроль, но также выдвигает на передний план новую эру конфиденциальности и настройки аудиовзаимодействий в комнате.

Интеграция этой системы в повседневную среду может изменить наше взаимодействие со смарт-устройствами и наш подход к конфиденциальности, сделав некогда вымышленные концепции частью нашей повседневной жизни. Глубокие возможности и этические соображения, связанные с такими достижениями, подчеркивают необходимость постоянного изучения и ответственного внедрения инновационных технологий.

Алекс МакФарланд — журналист и писатель, занимающийся искусственным интеллектом. Он сотрудничал с многочисленными стартапами и публикациями в области искусственного интеллекта по всему миру.