Лидеры мнений
Как использовать генеративные голоса ИИ этично для бизнеса в 2023 году

Конец 2022 года ознаменовался широким внедрением технологий ИИ благодаря ошеломляющей популярности OpenAI и ChatGPT. Впервые ИИ достиг массового успеха, доказав свою полезность и ценность в создании успешных бизнес-результатов.
Многие технологии ИИ, которые кажутся революционными для обычных людей в 2023 году, на самом деле уже несколько лет используются крупными бизнесами и медиа. Присоединяйтесь ко мне, и я рассмотрю более внимательно технологию, стоящую за этими решениями, в частности, генеративные системы ИИ для клонирования голоса, ее бизнес-преимущества и этические подходы к использованию ИИ.
Как работает клонирование голоса?
Вкратце, клонирование голоса позволяет одному человеку говорить голосом другого человека.
Оно использует генеративную технологию ИИ для создания записей голоса человека и использования их для генерации нового аудиоконтента с тем же голосом. По сути, это позволяет людям слышать, что кто-то мог бы сказать, даже если они не сказали этого сами.
С технической стороны, все кажется не очень сложным. Но если вы копнете немного глубже, есть некоторые минимальные требования, чтобы начать:
- Вам нужно как минимум 5 минут высококачественной записи аудио исходного голоса, чтобы склонировать его. Эти записи должны быть четкими и свободными от фонового шума или других искажений, поскольку любые несовершенства могут повлиять на точность вывода модели.
- После этого подайте эти записи в генеративную модель ИИ, чтобы создать “голосовой аватар”.
- Затем обучите модель точно воспроизводить закономерности речи в высоте и тайминге.
- Как только это будет завершено, эта обученная модель может генерировать неограниченный контент, используя исходный голос любого другого человека, становясь эффективным инструментом для создания реалистичных голосов.
Это тот момент, когда многие высказывают этические опасения. Что происходит, когда мы можем вставить любой текст в рот другого человека, и невозможно определить, являются ли эти слова реальными или фальшивыми?
Да, эта возможность уже давно стала реальностью. Как в случае с OpenAI и ChatGPT, мы сейчас сталкиваемся с рядом этических проблем, которые нельзя игнорировать.
Этические стандарты в ИИ
Как и многие другие новые технологии на начальном этапе внедрения, главная угроза заключается в создании негативной стигмы вокруг технологии, а не в признании угроз как источника обсуждения и ценного знания. Что важно, так это раскрытие методов, которые злоумышленники используют для злоупотребления технологией и ее продуктами, применение инструментов смягчения и продолжение обучения.
Сегодня у нас есть три уровня рамок для этических стандартов, связанных с использованием генеративного ИИ. Национальные и наднациональные регулирующие слои находятся на начальном этапе разработки. Мир политики может не поспевать за скоростью развития новых технологий, но мы уже можем наблюдать, как ЕС лидирует с Предложением ЕС по регулированию ИИ и Кодексом практики 2022 года по дезинформации, который очерчивает ожидания от крупных технологических компаний в борьбе с распространением злонамеренного манипулированного контента ИИ. На национальном уровне мы видим первые шаги в регулировании проблемой США и Великобританией с помощью Национальной задачи по глубоким подделкам и цифровому происхождению и Законопроекта об онлайн-безопасности.
Слой технологической отрасли движется быстрее, поскольку компании и технологи принимают эту новую реальность, связанную с новыми технологиями и их влиянием на безопасность и конфиденциальность общества. Диалог об этике генеративного ИИ живой и проложил путь к разработке отраслевых инициатив по кодексам поведения при использовании генеративного ИИ (например, Кодекс поведения Partnership on AI Synthetic Media) и этических заявлений, выпущенных различными компаниями. Вопрос в том, как сделать поведение практичным? И могут ли они повлиять на продукты, конкретные функции и процедуры команд?
Работая над этой проблемой с различными медиа и развлечениями, кибербезопасностью и сообществами ИИ-этики, я сформулировал несколько практических принципов для работы с контентом и голосами ИИ, в частности:
- Владельцы интеллектуальной собственности и компания, использующая склонированный голос, могут избежать многих потенциальных осложнений, связанных с использованием оригинальных голосов, подписав юридические соглашения.
- Владельцы проектов должны публично раскрыть использование склонированного голоса, чтобы слушатели не были введены в заблуждение.
- Компании, работающие над технологией ИИ для голоса, должны выделить определенный процент ресурсов на разработку технологии, способной обнаруживать и идентифицировать контент, сгенерированный ИИ.
- Маркировка контента, сгенерированного ИИ, водяными знаками, позволяет аутентифицировать голос.
- Каждый поставщик услуг ИИ должен рассмотреть каждый проект его влияния (социального, делового и уровня конфиденциальности) перед согласием работать над ним.
Конечно, принципы этики в ИИ не повлияют на распространение самодельных глубоких подделок в Интернете. Однако они вытолкнут любые проекты из серой зоны из досягаемости публичного рынка.
В 2021-22 годах голоса ИИ использовались в различных мейнстримовых проектах, которые ввели значительные последствия для этики и общества. Это включало клонирование голоса молодого Люка Скайуокера для сериала “Мандалорец”, голос ИИ для God of War 2 и голос Ричарда Никсона для исторической речи “В случае лунной катастрофы”.
Доверие к технологии растет за пределами медиа и развлечений. Традиционные бизнесы различных отраслей используют склонированные голоса в своих проектах. Вот несколько наиболее заметных случаев использования.
Примеры использования в отраслях
В 2023 году клонирование голоса продолжит свой рост вместе с различными бизнесами, которые готовы воспользоваться его многочисленными преимуществами. От здравоохранения и маркетинга до обслуживания клиентов и рекламной индустрии клонирование голоса революционизирует, как организации строят отношения со своими клиентами и оптимизируют свои рабочие процессы.
Клонирование голоса приносит пользу медицинским работникам и социальным работникам, которые работают в онлайн-среде. Цифровые аватары с тем же голосом, что и у медицинских работников, создают более сильные связи между ними и их пациентами, повышая доверие и удерживая клиентов.
Потенциальные применения клонирования голоса в кино- и развлекательной индустрии обширны. Дублирование контента на несколько языков, дополнительная запись диалогов для детей и взрослых и почти бесконечное количество вариантов настройки становятся возможными благодаря этой технологии.
Аналогично, в операционном секторе ИИ-обусловленное клонирование голоса может дать отличные результаты для брендов, которым необходимы экономически эффективные решения для интерактивных систем голосового ответа или корпоративных учебных видео. С технологией синтеза голоса актеры могут расширить свою аудиторию, увеличивая свою способность зарабатывать роялти от записей.
Наконец, в студиях рекламного производства появление клонирования голоса помогло значительно снизить затраты и количество часов, связанных с производством рекламы. Пока есть высококачественная запись для клонирования (даже от недоступных актеров), рекламу можно производить быстро и более творчески, чем когда-либо прежде.
Интересно, что предприятия и малые и средние бизнесы могут воспользоваться клонированием голоса, чтобы создать что-то уникальное для своих брендов. Крупные проекты могут реализовать свои самые амбициозные планы, а малые бизнесы могут получить доступ к ранее недоступным масштабным моделям. Это и есть真正ая демократизация.
Заключение
Клонирование голоса ИИ предлагает бизнесу революционные преимущества, такие как создание уникальных впечатлений для клиентов, интеграция возможностей обработки естественного языка в свои продукты и услуги, а также генерация высокоточных подделок голосов, которые звучат совершенно реально.
Бизнес, стремящийся сохранить свое конкурентное преимущество в 2023 году, должен обратить внимание на клонирование голоса ИИ. Компании могут использовать эту технологию, чтобы открыть множество новых возможностей для завоевания доли рынка и удержания клиентов, делая это этически ответственным образом.












