Lãnh đạo tư tưởng

Làm thế nào để sử dụng Giọng nói Tạo sinh AI một cách Đạo đức cho Doanh nghiệp vào năm 2023

Đã xuất bản 31 tháng 1, 2023

Đã cập nhật 23 tháng 5, 2026

Anna Bulakh

Kết thúc năm 2022 đã chứng kiến sự áp dụng rộng rãi các công nghệ AI do sự phổ biến đáng kinh ngạc của OpenAI và ChatGPT. Lần đầu tiên, AI đã đạt được sự hấp dẫn trên thị trường đại chúng bằng cách chứng minh sự hữu ích và giá trị của nó trong việc tạo ra các kết quả kinh doanh thành công.

Nhiều công nghệ AI dường như là một cuộc cách mạng đối với mọi người vào năm 2023 đã thực sự được sử dụng tích cực bởi các doanh nghiệp lớn và truyền thông trong vài năm. Hãy cùng tôi xem xét kỹ lưỡng công nghệ năng lượng cho các giải pháp này, đặc biệt là hệ thống tạo sinh AI cho việc nhân bản giọng nói, lợi ích kinh doanh của nó và các phương pháp đạo đức để sử dụng AI.

Làm thế nào để nhân bản giọng nói hoạt động?

Tóm lại, nhân bản giọng nói cho phép một người nói bằng giọng nói của người khác.

Nó sử dụng công nghệ tạo sinh AI để tạo ra các bản ghi âm của giọng nói của một người và sử dụng chúng để tạo ra nội dung âm thanh mới với giọng nói của người đó. Nó cơ bản cho phép mọi người nghe thấy những gì ai đó sẽ nói, ngay cả khi họ không nói nó mình.

Về mặt kỹ thuật, mọi thứ không có vẻ quá phức tạp. Nhưng nếu bạn đi sâu vào, có một số yêu cầu tối thiểu để bắt đầu:

Bạn cần ít nhất 5 phút bản ghi âm chất lượng cao của giọng nói nguồn để nhân bản nó. Những bản ghi này nên rõ ràng và không có tiếng ồn nền hoặc các biến dạng khác, vì bất kỳ sai sót nào cũng có thể ảnh hưởng đến độ chính xác của đầu ra mô hình.
Sau đó, cho những bản ghi này vào một mô hình tạo sinh AI để tạo ra một “hình đại diện giọng nói.”
Sau đó, huấn luyện mô hình để chính xác tái tạo các mẫu giọng nói về cao độ và thời gian.
Khi hoàn thành, mô hình đã được đào tạo này có thể tạo ra nội dung không giới hạn bằng giọng nói nguồn của bất kỳ người nào khác, trở thành một công cụ hiệu quả để tạo ra các giọng nói giả chân thực.

Đây là điểm mà nhiều người đặt ra các vấn đề về đạo đức. Điều gì xảy ra khi chúng ta có thể chèn bất kỳ văn bản nào vào miệng của người khác và không thể phân biệt được những từ đó là thực hay giả?

Vâng, khả năng này đã trở thành hiện thực từ lâu. Giống như trường hợp của OpenAI và ChatGPT, chúng ta hiện đang phải đối mặt với một số vấn đề đạo đức không thể bỏ qua.

Tiêu chuẩn đạo đức trong AI

Như với nhiều công nghệ mới khác trong giai đoạn đầu của việc áp dụng, mối đe dọa chính là tạo ra một hình ảnh tiêu cực về công nghệ thay vì thừa nhận các mối đe dọa như một nguồn cho thảo luận và kiến thức quý giá. Điều quan trọng là phải暴露 các phương pháp mà các tác nhân xấu sử dụng để lạm dụng công nghệ và sản phẩm của nó, áp dụng các công cụ giảm thiểu và tiếp tục học hỏi.

Hôm nay chúng ta có ba lớp khuôn khổ cho các tiêu chuẩn đạo đức liên quan đến việc sử dụng tạo sinh AI. Các lớp quy định quốc gia và siêu quốc gia đang trong giai đoạn phát triển ban đầu. Thế giới chính sách có thể không theo kịp tốc độ phát triển của công nghệ mới nổi, nhưng chúng ta đã có thể quan sát thấy EU dẫn đầu với Đề xuất của EU về Quy định AI và Bộ quy tắc thực hành về Thông tin sai lệch năm 2022 nêu rõ các kỳ vọng cho các công ty công nghệ lớn để giải quyết việc lan truyền nội dung AI bị thao túng một cách độc ác. Ở cấp quốc gia, chúng ta thấy các bước quy định đầu tiên của Mỹ và Anh trong việc giải quyết vấn đề với Nhóm nhiệm vụ Quốc gia về Deepfake và Chứng cứ số của Mỹ và Đạo luật An toàn Trực tuyến của Anh.

Lớp công nghệ đang di chuyển nhanh hơn vì các công ty và nhà công nghệ đang chấp nhận thực tế mới này liên quan đến các công nghệ mới nổi và tác động của chúng đối với an ninh và quyền riêng tư của xã hội. Cuộc đối thoại về đạo đức của tạo sinh AI rất sôi động và đã dẫn đường cho việc phát triển các sáng kiến của ngành về Quy tắc ứng xử xung quanh việc sử dụng tạo sinh AI (ví dụ: Quy tắc ứng xử về Truyền thông Tổng hợp của Đối tác AI) và các tuyên bố đạo đức được phát hành bởi các công ty khác nhau. Câu hỏi là, làm thế nào để thực hiện quy tắc ứng xử một cách thực tế? Và, chúng có thể ảnh hưởng đến sản phẩm, tính năng cụ thể và quy trình của các nhóm không?

Sau khi làm việc về vấn đề này với một số cộng đồng truyền thông và giải trí, an ninh mạng và các cộng đồng Đạo đức AI, tôi đã hình thành một số nguyên tắc thực tế để đối phó với nội dung và giọng nói AI cụ thể:

Chủ sở hữu bản quyền và công ty sử dụng giọng nói nhân bản có thể tránh được nhiều sự phức tạp tiềm tàng liên quan đến việc sử dụng giọng nói gốc bằng cách ký các thỏa thuận pháp lý.
Chủ sở hữu dự án nên công khai tiết lộ việc sử dụng giọng nói nhân bản để người nghe không bị lừa đảo.
Các công ty làm việc về công nghệ AI cho giọng nói nên phân bổ một tỷ lệ tài nguyên để phát triển công nghệ có khả năng phát hiện và xác định nội dung được tạo ra bởi AI.
Gán nhãn nội dung được tạo ra bởi AI với các watermark cho phép xác thực giọng nói.
Mỗi nhà cung cấp dịch vụ AI nên xem xét từng dự án về tác động của nó (cấp độ xã hội, kinh doanh và quyền riêng tư) trước khi đồng ý thực hiện nó.

Tất nhiên, các nguyên tắc đạo đức trong AI sẽ không ảnh hưởng đến sự lan truyền của các deep fake tự làm trực tuyến. Tuy nhiên, chúng sẽ đẩy các dự án trong vùng xám ra khỏi tầm với của thị trường công cộng.

Vào năm 2021-22, các giọng nói AI đã được sử dụng trong các dự án chính流 khác nhau có ý nghĩa sâu sắc về đạo đức và xã hội. Chúng bao gồm nhân bản giọng nói của Luke Skywalker trẻ cho loạt phim Mandalorian, giọng nói AI cho God of War 2 và giọng nói của Richard Nixon cho bài phát biểu lịch sử ‘Trong trường hợp Thảm họa Mặt trăng’.

Sự tin tưởng vào công nghệ đang phát triển vượt ra ngoài truyền thông và giải trí. Các doanh nghiệp truyền thống trên nhiều ngành công nghiệp đang sử dụng giọng nói nhân bản trong các dự án của họ. Dưới đây là một số trường hợp sử dụng nổi bật nhất.

Trường hợp sử dụng trong ngành

Vào năm 2023, nhân bản giọng nói sẽ tiếp tục tăng trưởng cùng với các doanh nghiệp khác nhau sẵn sàng tận dụng các lợi ích đa dạng của nó. Từ chăm sóc sức khỏe và tiếp thị đến dịch vụ khách hàng và ngành quảng cáo, nhân bản giọng nói đang cách mạng hóa cách các tổ chức xây dựng mối quan hệ với khách hàng và tối ưu hóa quy trình làm việc của họ.

Lợi ích của nhân bản giọng nói đối với các chuyên gia y tế và công nhân xã hội làm việc trong môi trường trực tuyến. Các hình đại diện kỹ thuật số có giọng nói giống như các chuyên gia y tế tạo ra mối liên kết mạnh mẽ hơn giữa họ và bệnh nhân, tăng cường sự tin tưởng và giữ chân khách hàng.

Các ứng dụng tiềm năng của nhân bản giọng nói trong ngành công nghiệp điện ảnh và giải trí là rất lớn. Lồng tiếng cho nội dung vào nhiều ngôn ngữ, thay thế thoại cho trẻ em và người lớn và gần như vô số tùy chọn tùy chỉnh đều có thể thực hiện được nhờ công nghệ này.

Tương tự, trong lĩnh vực hoạt động, nhân bản giọng nói AI có thể mang lại kết quả xuất sắc cho các thương hiệu cần giải pháp tiết kiệm chi phí cho hệ thống phản hồi giọng nói tương tác hoặc video đào tạo doanh nghiệp. Với công nghệ tổng hợp giọng nói, các diễn viên có thể mở rộng phạm vi tiếp cận của mình đồng thời tăng khả năng kiếm tiền từ các bản ghi âm.

Cuối cùng, trong các studio sản xuất quảng cáo, sự xuất hiện của nhân bản giọng nói đã giúp giảm đáng kể chi phí và số giờ liên quan đến sản xuất thương mại.只要 có bản ghi âm chất lượng cao để nhân bản (ngay cả từ các diễn viên không có sẵn), quảng cáo có thể được sản xuất nhanh chóng và sáng tạo hơn bao giờ hết.

Thật thú vị, các doanh nghiệp và doanh nghiệp vừa và nhỏ có thể tận dụng nhân bản giọng nói để tạo ra điều gì đó độc đáo cho thương hiệu của họ. Các dự án lớn có thể thực hiện các kế hoạch tham vọng nhất của họ, trong khi các doanh nghiệp nhỏ có thể tiếp cận các mô hình quy mô trước đây không thể tiếp cận được. Đó là ý nghĩa thực sự của sự dân chủ hóa.

Kết thúc

Nhân bản giọng nói AI mang lại cho doanh nghiệp những lợi ích thay đổi cuộc chơi như tạo ra trải nghiệm khách hàng độc đáo, tích hợp khả năng xử lý ngôn ngữ tự nhiên vào sản phẩm và dịch vụ của họ và tạo ra những bản sao giọng nói chính xác và nghe thật.

Các doanh nghiệp muốn duy trì lợi thế cạnh tranh của mình vào năm 2023 nên xem xét nhân bản giọng nói AI. Các công ty có thể sử dụng công nghệ này để mở ra nhiều khả năng mới để giành thị phần và giữ chân khách hàng đồng thời thực hiện điều đó một cách có trách nhiệm về mặt đạo đức.

Anna Bulakh

Anna là Trưởng bộ phận Đạo đức và Đối tác tại Respeecher, một công nghệ nhân bản giọng nói được giải thưởng Emmy dựa tại Ukraine. Anna là một cựu Cố vấn Chính sách tại Reface, một ứng dụng truyền thông tổng hợp được hỗ trợ bởi AI và là đồng sáng lập công nghệ của công cụ chống thông tin sai lệch Cappture được tài trợ bởi chương trình tăng tốc Startup Wise Guys. Anna có 11 năm kinh nghiệm trong các chính sách an ninh và quốc phòng, công nghệ và xây dựng khả năng chống chịu. Cô là một cựu Nghiên cứu viên tại Trung tâm Quốc tế về Quốc phòng và An ninh ở Tallinn và Viện Nghiên cứu An ninh Prague. Cô cũng đã tư vấn cho các công ty lớn của Ukraine về xây dựng khả năng chống chịu như một phần của Lực lượng Đặc nhiệm Chiến tranh Hybrid tại Trường Kinh tế Kyiv.

Unite.AI

Làm thế nào để sử dụng Giọng nói Tạo sinh AI một cách Đạo đức cho Doanh nghiệp vào năm 2023

Làm thế nào để nhân bản giọng nói hoạt động?

Tiêu chuẩn đạo đức trong AI

Trường hợp sử dụng trong ngành

Kết thúc

Khám phá thêm