Trí tuệ nhân tạo
Học Sâu Đang Tái Định Hình Ngành Phát Thanh

Học sâu đã trở thành một từ khóa trong nhiều lĩnh vực, và các tổ chức phát thanh cũng đang bắt đầu khám phá tất cả các tiềm năng mà nó có thể mang lại, từ báo cáo tin tức đến các bộ phim và chương trình, cả trong rạp chiếu phim và trên truyền hình.
Như TechRadar đã báo cáo, số lượng cơ hội mà học sâu mang lại trong lĩnh vực sản xuất video, chỉnh sửa và lập danh mục đang ngày càng tăng. Nhưng như đã lưu ý, công nghệ này không chỉ giới hạn trong các nhiệm vụ lặp đi lặp lại trong phát thanh, vì nó cũng có thể “cải thiện quá trình sáng tạo, nâng cao chất lượng video và giúp bảo tồn các kho lưu trữ video khổng lồ mà nhiều studio sở hữu.”
Về việc tạo ra và chỉnh sửa video, nó được đề cập rằng Warner Bros. gần đây đã phải chi 25 triệu đô la cho việc quay lại các cảnh trong bộ phim ‘Justice League’ và một phần trong số tiền đó đã được sử dụng để xóa bỏ râu của ngôi sao Henry Cavill đã mọc và không thể cạo vì cam kết chồng chéo. Việc sử dụng học sâu trong các quá trình tốn thời gian và tốn kém như vậy trong quá trình hậu sản xuất chắc chắn sẽ được sử dụng một cách hiệu quả.
Ngay cả các giải pháp phổ biến như Flo cũng cho phép sử dụng học sâu để tạo ra video tự động chỉ bằng cách mô tả ý tưởng của bạn. Phần mềm sau đó sẽ tìm kiếm các video có thể liên quan được lưu trữ trong một thư viện nhất định và chỉnh sửa chúng lại với nhau tự động.
Flo cũng có thể sắp xếp và phân loại video, giúp dễ dàng tìm kiếm một phần cụ thể của cảnh quay. Các công nghệ như vậy cũng cho phép dễ dàng xóa bỏ cảnh quay không mong muốn hoặc tạo ra một danh sách đề xuất cá nhân dựa trên video mà ai đó đã thể hiện sự quan tâm.
Google đã đưa ra một mạng nơ-ron “có thể tự động tách nền trước và nền sau của một video. Những gì trước đây đòi hỏi một màn hình xanh lá cây có thể được thực hiện mà không cần thiết bị đặc biệt.”
Deep fake đã tạo ra tên tuổi cho mình, cả tốt và xấu, nhưng khả năng sử dụng nó trong hiệu ứng đặc biệt đã đạt đến mức rất cao.
Khu vực mà học sâu chắc chắn sẽ tạo ra sự khác biệt là trong việc phục hồi các bộ phim kinh điển, vì Kho lưu trữ phim và truyền hình UCLA, gần một nửa số bộ phim được sản xuất trước năm 1950 đã biến mất và 90% bản in phim kinh điển hiện đang ở trong tình trạng rất kém.
Việc tạo màu cho cảnh quay đen trắng vẫn là một chủ đề gây tranh cãi giữa các nhà làm phim, nhưng những người quyết định đi theo con đường đó có thể sử dụng các công cụ của Nvidia, điều này sẽ rút ngắn quá trình dài dòng như vậy vì nó hiện yêu cầu nghệ sĩ chỉ cần tô màu cho một khung hình của cảnh và học sâu sẽ thực hiện phần còn lại từ đó. Mặt khác, Google đã đưa ra một công nghệ có thể tái tạo lại một phần của cảnh quay dựa trên khung hình bắt đầu và kết thúc.
Nhận dạng khuôn mặt/hình dạng đã được sử dụng rộng rãi, từ việc phân loại bộ sưu tập video hoặc lưu trữ, tìm kiếm các đoạn phim có diễn viên hoặc người dẫn chương trình nhất định, hoặc đếm thời gian chính xác của một diễn viên trong video hoặc phim. TechRadar đề cập rằng Sky News gần đây đã sử dụng nhận dạng khuôn mặt để xác định các khuôn mặt nổi tiếng tại đám cưới hoàng gia.
Công nghệ này hiện đang được sử dụng rộng rãi trong phát thanh thể thao để, ví dụ, “theo dõi chuyển động của bóng, hoặc xác định các yếu tố quan trọng khác của trò chơi, như bàn thắng.” Trong bóng đá (bóng đá) công nghệ này, được đặt tên là VAR, thực sự được sử dụng trong nhiều giải đấu và giải vô địch quốc gia như một công cụ của trọng tài trong trận đấu.
Phát trực tuyến là một khía cạnh khác của phát thanh mà có thể được hưởng lợi từ học sâu. Các mạng nơ-ron có thể tái tạo lại các khung hình độ phân giải cao từ đầu vào độ phân giải thấp, giúp người xem có thể tận hưởng chất lượng xem tốt hơn, ngay cả khi tín hiệu đầu vào ban đầu không hoàn toàn đáp ứng tiêu chuẩn.












