sơ khai Công nghệ Acoustic Swarm tiên tiến định hình tương lai của âm thanh trong phòng - Unite.AI
Kết nối với chúng tôi

Trí tuệ nhân tạo

Công nghệ Acoustic Swarm tiên tiến định hình tương lai của âm thanh trong phòng

Được phát hành

 on

Hình ảnh: Đại học Washington

Trong một bước phát triển mang tính đột phá, một nhóm các nhà nghiên cứu tại Đại học Washington đã giới thiệu một hệ thống kiểm soát âm thanh tiên tiến hứa hẹn sẽ xác định lại động lực học của âm thanh trong phòng. Công nghệ độc đáo, giống như một đàn robot, sử dụng micrô tự triển khai để phân chia các phòng thành các khu vực phát biểu riêng biệt.

Công nghệ tiên phong này tạo ra một mạng lưới các thực thể robot nhỏ tự phân tán trên nhiều bề mặt khác nhau, phát ra âm thanh tần số cao giống như tiếng dơi điều hướng để tránh chướng ngại vật và tự phân bổ để kiểm soát âm thanh và cách ly giọng nói tối ưu. Hệ thống này, thông qua việc triển khai phức tạp, sẽ vượt qua những hạn chế của loa thông minh dành cho người tiêu dùng hiện tại và cho phép nâng cao sự khác biệt và bản địa hóa các cuộc hội thoại đồng thời.

Malek Itani, nghiên cứu sinh tiến sĩ của UW và là đồng tác giả chính của cuốn sách nghiên cứu, nhấn mạnh những khả năng chưa từng có của đàn âm thanh này, đồng thời cho biết: “Lần đầu tiên, bằng cách sử dụng cái mà chúng tôi gọi là 'bầy đàn âm thanh' robot, chúng tôi có thể theo dõi vị trí của nhiều người đang nói chuyện trong phòng và tách biệt lời nói của họ. .”

Giải quyết những thách thức trong thế giới thực

Mặc dù các công cụ họp ảo hiện tại cho phép kiểm soát ai sẽ phát biểu, nhưng việc quản lý các cuộc hội thoại trong phòng trong môi trường thực tế, đặc biệt là trong môi trường đông đúc, đặt ra nhiều thách thức. Công nghệ tiên tiến này quản lý để tách biệt các giọng nói cụ thể và tách biệt các cuộc thảo luận đồng thời, ngay cả giữa những cá nhân có tông giọng giống nhau mà không cần tín hiệu trực quan hoặc máy ảnh. Điều này đánh dấu một bước tiến đáng kể trong việc quản lý âm thanh trong các không gian như phòng khách, nhà bếp và văn phòng, nơi mà việc phân biệt nhiều giọng nói là then chốt.

Hệ thống này đã thể hiện tính hiệu quả hoàn hảo, có thể phân biệt các giọng nói khác nhau trong phạm vi 1.6 feet với nhau trong 90% thời gian trong các môi trường khác nhau. Đồng tác giả Tuochao Chen lưu ý: “Chúng tôi đã phát triển mạng lưới thần kinh sử dụng các tín hiệu bị trễ thời gian này để phân tách những gì mỗi người đang nói và theo dõi vị trí của họ trong một không gian”. Ông nói rõ thêm rằng điều này cho phép cách ly và xác định vị trí của từng giọng nói trong một căn phòng nơi có nhiều cuộc trò chuyện diễn ra đồng thời.

Loa thông minh thay đổi hình dạng tạo vùng giọng nói

Tăng cường quyền riêng tư và kiểm soát

Các nhà nghiên cứu dự tính ứng dụng công nghệ này trong nhà thông minh, cung cấp cho người dùng khả năng kiểm soát nâng cao đối với âm thanh trong phòng và tương tác với loa thông minh. Hệ thống hứa hẹn mang lại trải nghiệm tinh tế, cho phép tạo ra các vùng hoạt động, trong đó chỉ những cá nhân ở những khu vực cụ thể mới có thể tương tác bằng giọng nói với thiết bị. Đây là một bước quan trọng hướng tới hiện thực hóa các khái niệm từ khoa học viễn tưởng, thể hiện khả năng tạo ra các vùng hoạt động và tắt tiếng trong thế giới thực.

Tuy nhiên, sự đổi mới đi kèm với trách nhiệm và các nhà nghiên cứu nhận thức sâu sắc về ý nghĩa riêng tư của công nghệ đó. Họ đã thiết lập các biện pháp bảo vệ, bao gồm ánh sáng nhìn thấy được trên các robot đang hoạt động và xử lý cục bộ tất cả dữ liệu âm thanh, đảm bảo quyền riêng tư của người dùng.

Itani khẳng định: “Nó có tiềm năng thực sự mang lại lợi ích cho quyền riêng tư.

Hệ thống cung cấp khả năng tạo bong bóng riêng tư và vùng tắt tiếng, đảm bảo rằng các cuộc trò chuyện vẫn ở chế độ riêng tư và không được ghi lại dựa trên tùy chọn của người dùng, từ đó đóng vai trò như một công cụ để nâng cao quyền riêng tư ngoài những gì loa thông minh hiện tại cho phép.

Phát minh này của các nhà nghiên cứu tại Đại học Washington đánh dấu một bước ngoặt quan trọng trong công nghệ âm thanh, kết hợp công nghệ robot tiên tiến và khả năng kiểm soát âm thanh phức tạp để giải quyết những thách thức trong thế giới thực. Nó không chỉ hứa hẹn nâng cao trải nghiệm và khả năng kiểm soát của người dùng mà còn mang đến kỷ nguyên mới về quyền riêng tư và khả năng tùy chỉnh trong các tương tác âm thanh trong phòng.

Việc tích hợp hệ thống này trong môi trường hàng ngày có thể xác định lại sự tương tác của chúng ta với các thiết bị thông minh và cách tiếp cận quyền riêng tư của chúng ta, biến những khái niệm từng là hư cấu trở thành một phần trong cuộc sống hàng ngày của chúng ta. Những khả năng sâu sắc và những cân nhắc về mặt đạo đức của những tiến bộ như vậy nhấn mạnh sự cần thiết phải liên tục khám phá và triển khai có trách nhiệm các công nghệ đổi mới.

Alex McFarland là một nhà báo và nhà văn về AI đang khám phá những phát triển mới nhất về trí tuệ nhân tạo. Anh ấy đã cộng tác với nhiều công ty khởi nghiệp và ấn phẩm về AI trên toàn thế giới.