Connect with us

Cách Sử Dụng Giọng Nói Trí Tuệ Nhân Tạo Một Cách Đạo Đức Cho Doanh Nghiệp Vào Năm 2023

Lãnh đạo tư tưởng

Cách Sử Dụng Giọng Nói Trí Tuệ Nhân Tạo Một Cách Đạo Đức Cho Doanh Nghiệp Vào Năm 2023

mm

Cuối năm 2022 đã chứng kiến sự áp dụng rộng rãi các công nghệ AI do sự phổ biến đáng kinh ngạc của OpenAI và ChatGPT. Lần đầu tiên, AI đã đạt được sự hấp dẫn trên thị trường đại chúng bằng cách chứng minh sự hữu ích và giá trị của nó trong việc tạo ra các kết quả kinh doanh thành công.

Nhiều công nghệ AI dường như là một cuộc cách mạng đối với mọi người vào năm 2023 đã thực sự được sử dụng tích cực bởi các doanh nghiệp lớn và truyền thông trong vài năm. Hãy cùng tôi khám phá kỹ hơn về công nghệ powers các giải pháp này, đặc biệt là hệ thống trí tuệ nhân tạo tạo giọng nói, lợi ích kinh doanh của nó và cách tiếp cận đạo đức khi sử dụng AI.

Cách thức hoạt động của việc nhân bản giọng nói?

Tóm lại, việc nhân bản giọng nói cho phép một người nói bằng giọng nói của người khác.

Nó sử dụng công nghệ trí tuệ nhân tạo tạo ra để tạo ra các bản ghi âm của giọng nói của một người và sử dụng chúng để tạo ra nội dung âm thanh mới với giọng nói của người đó. Về cơ bản, nó cho phép mọi người nghe thấy điều gì đó mà ai đó sẽ nói, ngay cả khi họ không nói nó mình.
Trên mặt kỹ thuật, mọi thứ không có vẻ quá phức tạp. Nhưng nếu bạn đi sâu hơn một chút, có một số yêu cầu tối thiểu để bắt đầu:

  1. Bạn cần ít nhất 5 phút ghi âm chất lượng cao của giọng nói nguồn để nhân bản nó. Những bản ghi này nên rõ ràng và không có tiếng ồn nền hoặc các biến dạng khác, vì bất kỳ sự không hoàn hảo nào cũng có thể ảnh hưởng đến độ chính xác của đầu ra mô hình.
  2. Sau đó, cho các bản ghi này vào một mô hình trí tuệ nhân tạo tạo ra để tạo ra một “hình đại diện giọng nói.”
  3. Sau đó, huấn luyện mô hình để chính xác tái tạo các mẫu nói về cao độ và thời gian.
  4. Một khi hoàn thành, mô hình đã được đào tạo này có thể tạo ra nội dung không giới hạn bằng giọng nói của người khác, trở thành một công cụ hiệu quả để tạo ra các giọng nói giả chân thực.

Đây là điểm mà nhiều người đặt ra các vấn đề về đạo đức. Điều gì xảy ra khi chúng ta có thể chèn bất kỳ văn bản nào vào miệng của một người khác và không thể phân biệt được liệu những lời đó là thực sự hay giả?
Vâng, khả năng này đã trở thành hiện thực từ lâu. Giống như trường hợp của OpenAI và ChatGPT, chúng ta hiện đang phải đối mặt với một số vấn đề về đạo đức mà không thể bị bỏ qua.

Tiêu chuẩn đạo đức trong AI

Giống như nhiều công nghệ mới khác trong giai đoạn đầu của việc áp dụng, mối đe dọa chính là tạo ra một cái nhìn tiêu cực về công nghệ chứ không phải là công nhận các mối đe dọa như một nguồn cho thảo luận và kiến thức quý giá. Điều quan trọng là tiết lộ các phương pháp mà những kẻ xấu sử dụng để lạm dụng công nghệ và sản phẩm của nó, áp dụng các công cụ giảm thiểu và tiếp tục học hỏi.

Ngày nay chúng ta có ba lớp khuôn khổ cho các tiêu chuẩn đạo đức liên quan đến việc sử dụng trí tuệ nhân tạo tạo ra. Các lớp quy định quốc gia và siêu quốc gia đang trong giai đoạn phát triển ban đầu. Thế giới chính sách có thể không theo kịp tốc độ phát triển của công nghệ mới nổi, nhưng chúng ta đã có thể quan sát thấy EU dẫn đầu với Đề xuất của EU về Quy định AIBộ quy tắc thực hành năm 2022 về Thông tin sai lệch phác thảo các kỳ vọng cho các công ty lớn về công nghệ để giải quyết việc lan truyền nội dung bị thao túng bởi AI. Ở cấp quốc gia, chúng ta thấy các bước quy định đầu tiên của Mỹ và Anh trong việc giải quyết vấn đề với Lực lượng đặc nhiệm Quốc gia về Deepfake và Chứng nhận sốĐạo luật An toàn Trực tuyến.

Lớp công nghệ đang di chuyển nhanh hơn khi các công ty và nhà công nghệ chấp nhận hiện thực mới này như nó liên quan đến các công nghệ mới nổi và tác động của chúng đối với an ninh và quyền riêng tư của xã hội. Đối thoại về đạo đức của trí tuệ nhân tạo tạo ra là sôi động và đã dẫn đường tới việc phát triển các sáng kiến của ngành về Mã hành vi đối với việc sử dụng trí tuệ nhân tạo tạo ra (ví dụ: Mã hành vi truyền thông tổng hợp của Đối tác về AI) và các tuyên bố đạo đức được phát hành bởi các công ty khác nhau. Câu hỏi là, làm thế nào để làm cho hành vi này trở nên thực tế? Và, chúng có thể ảnh hưởng đến sản phẩm, tính năng cụ thể và quy trình của các đội không?

Sau khi làm việc trên vấn đề này với một số cộng đồng truyền thông và giải trí, an ninh mạng và các cộng đồng đạo đức AI, tôi đã xây dựng một số nguyên tắc thực tế để đối phó với nội dung và giọng nói AI:

  1. Chủ sở hữu IP và công ty sử dụng giọng nói nhân bản có thể tránh nhiều sự phức tạp tiềm năng liên quan đến việc sử dụng giọng nói gốc bằng cách ký các thỏa thuận pháp lý.
  2. Chủ sở hữu dự án nên công khai tiết lộ việc sử dụng giọng nói nhân bản để người nghe không bị lừa đảo.
  3. Các công ty làm việc trên công nghệ AI cho giọng nói nên phân bổ một tỷ lệ nguồn lực để phát triển công nghệ có khả năng phát hiện và xác định nội dung được tạo ra bởi AI.
  4. Gán nhãn nội dung được tạo ra bởi AI với các dấu nước cho phép xác thực giọng nói.
  5. Mỗi nhà cung cấp dịch vụ AI nên xem xét từng dự án về tác động (cấp độ xã hội, kinh doanh và quyền riêng tư) trước khi đồng ý làm việc trên nó.

Tất nhiên, các nguyên tắc của đạo đức trong AI sẽ không ảnh hưởng đến sự lan truyền của các bản sao giả mạo tự làm trên internet. Tuy nhiên, chúng sẽ đẩy bất kỳ dự án nào trong vùng xám ra khỏi tầm với của thị trường công cộng.

Vào năm 2021-22, các giọng nói AI đã được sử dụng trong các dự án chính thống khác nhau đã giới thiệu những ý nghĩa đáng kể về đạo đức và xã hội. Những dự án này bao gồm nhân bản giọng nói của Luke Skywalker trẻ cho loạt phim Mandalorian, giọng nói AI cho God of War 2giọng nói của Richard Nixon cho bài phát biểu lịch sử ‘Trong trường hợp thảm họa Mặt trăng’.

Sự tin tưởng vào công nghệ đang phát triển vượt ra ngoài truyền thông và giải trí. Các doanh nghiệp truyền thống trên nhiều ngành công nghiệp đang sử dụng giọng nói nhân bản trong các dự án của họ. Dưới đây là một số trường hợp sử dụng nổi bật nhất.

Trường hợp sử dụng trong ngành

Vào năm 2023, việc nhân bản giọng nói sẽ tiếp tục tăng trưởng cùng với các doanh nghiệp khác nhau được hưởng lợi từ nhiều lợi ích của nó. Từ chăm sóc sức khỏe và tiếp thị đến dịch vụ khách hàng và ngành quảng cáo, việc nhân bản giọng nói đang cách mạng hóa cách các tổ chức xây dựng mối quan hệ với khách hàng và tối ưu hóa quy trình làm việc của họ.

Việc nhân bản giọng nói mang lại lợi ích cho các chuyên gia y tế và công nhân xã hội làm việc trong môi trường trực tuyến. Các hình đại diện kỹ thuật số có giọng nói giống như các chuyên gia y tế giúp tạo ra mối liên kết mạnh mẽ hơn giữa họ và bệnh nhân, tăng cường niềm tin và giữ chân khách hàng.

Các ứng dụng tiềm năng của việc nhân bản giọng nói trong ngành công nghiệp điện ảnh và giải trí là vô cùng lớn. Việc lồng tiếng cho nội dung vào nhiều ngôn ngữ, thay thế thoại cho trẻ em và người lớn và vô số tùy chọn tùy chỉnh đều có thể thực hiện được nhờ công nghệ này.

Tương tự, trong lĩnh vực hoạt động, việc nhân bản giọng nói AI có thể mang lại kết quả xuất sắc cho các thương hiệu cần giải pháp tiết kiệm chi phí cho hệ thống phản hồi giọng nói tương tác hoặc video đào tạo doanh nghiệp. Với công nghệ tổng hợp giọng nói, các diễn viên có thể mở rộng phạm vi tiếp cận của mình đồng thời tăng khả năng kiếm tiền từ các bản ghi.

Cuối cùng, trong các xưởng sản xuất quảng cáo, sự xuất hiện của việc nhân bản giọng nói đã giúp giảm đáng kể chi phí và số giờ liên quan đến sản xuất thương mại.只要 có một bản ghi chất lượng cao để nhân bản (ngay cả từ các diễn viên không có sẵn), quảng cáo có thể được sản xuất nhanh chóng và sáng tạo hơn bao giờ hết.

Đáng chú ý, các doanh nghiệp và doanh nghiệp nhỏ có thể tận dụng việc nhân bản giọng nói để tạo ra điều gì đó độc đáo cho thương hiệu của họ. Các dự án lớn có thể thực hiện các kế hoạch tham vọng nhất của họ, trong khi các doanh nghiệp nhỏ có thể tiếp cận các mô hình quy mô trước đây không thể tiếp cận được. Đó là ý nghĩa thực sự của sự dân chủ hóa.

Kết thúc

Việc nhân bản giọng nói AI mang lại cho doanh nghiệp những lợi ích thay đổi cuộc chơi như tạo ra trải nghiệm khách hàng độc đáo, tích hợp khả năng xử lý ngôn ngữ tự nhiên vào sản phẩm và dịch vụ của họ và tạo ra các bản sao giọng nói chính xác cao nghe có vẻ hoàn toàn thật.

Các doanh nghiệp muốn duy trì lợi thế cạnh tranh của mình vào năm 2023 nên xem xét việc nhân bản giọng nói AI. Các công ty có thể sử dụng công nghệ này để mở ra nhiều khả năng mới để giành thị phần và giữ chân khách hàng trong khi làm điều đó một cách có trách nhiệm về mặt đạo đức.

Anna là Trưởng bộ phận Đạo đức và Đối tác tại Respeecher, một công nghệ nhân bản giọng nói được giải thưởng Emmy dựa tại Ukraine. Anna là một cựu Cố vấn Chính sách tại Reface, một ứng dụng truyền thông tổng hợp được hỗ trợ bởi AI và là đồng sáng lập công nghệ của công cụ chống thông tin sai lệch Cappture được tài trợ bởi chương trình tăng tốc Startup Wise Guys. Anna có 11 năm kinh nghiệm trong các chính sách an ninh và quốc phòng, công nghệ và xây dựng khả năng chống chịu. Cô là một cựu Nghiên cứu viên tại Trung tâm Quốc tế về Quốc phòng và An ninh ở Tallinn và Viện Nghiên cứu An ninh Prague. Cô cũng đã tư vấn cho các công ty lớn của Ukraine về xây dựng khả năng chống chịu như một phần của Lực lượng Đặc nhiệm Chiến tranh Hybrid tại Trường Kinh tế Kyiv.