Вештачка интелигенција

Мета го откри говорното сандаче за модел на говорна генерација

Објавено

пред 6 месеци

Јуни 17, 2023

Мета неодамна направи значителен напредок во доменот на генеративната вештачка интелигенција за говор, откривајќи врвен модел со вештачка интелигенција наречен Voicebox. Овој развој претставува значителен чекор напред во генеративното истражување на вештачката интелигенција, демонстрирајќи потенцијални идни апликации во мноштво области.

Voicebox, новиот модел на ВИ на Мета, претставува пробив во задачите за генерирање говор. Извонредната карактеристика на Voicebox е неговата способност да извршува задачи за кои не бил експлицитно обучен да ги прави, користејќи ја моќта на учењето во контекст. Ова му овозможува на Voicebox да произведува висококвалитетни аудио клипови и да го уредува претходно снименото аудио, како што се отстранување на несакани звуци како сирени од автомобил или лаење на кучиња, сето тоа притоа зачувувајќи ја содржината и стилот на звукот. Моделот е исто така повеќејазичен, способен да генерира говор на шест различни јазици.

Појавата на повеќенаменски генеративни модели на вештачка интелигенција како Voicebox укажува на возбудлива иднина. Тие би можеле да послужат за давање гласови со природен звук на виртуелните асистенти и ликовите што не играат во метаверзумот, да им овозможат на лицата со оштетен вид да слушаат пишани пораки од пријателите што ги чита вештачката интелигенција во нивните гласови и да им обезбедат на креаторите иновативни алатки за создавање и уредување аудиозаписи. за видеа, меѓу бројните други можности.

Разноврсни способности на Voicebox

Разновидноста на Voicebox опфаќа различни задачи, претставувајќи се како иновативна алатка во просторот за аудио и вештачка интелигенција:

Синтеза на текст во говор во контекст: Voicebox може да користи краток аудио примерок, краток од две секунди, за да одговара на стилот на звук за генерирање текст во говор.
Уредување на говор и намалување на шумот: Гласовното сандаче може да репродуцира прекинати делови од говорот или да ги замени погрешно изговорените зборови без потреба од повторно снимање на целиот говор. Во суштина, тој делува како гума за уредување аудио, нудејќи уникатно решение за вообичаените аудио предизвици.
Трансфер на стилски меѓујазичен стил: Voicebox може да генерира читање на текст на кој било од шесте јазици, дури и ако примерокот на говор и текстот се на различни јазици. Оваа способност може да биде клучна за да им помогне на луѓето да комуницираат автентично, дури и ако немаат заеднички јазик.
Различно земање примероци на говор: Поради различното учење на податоци, Voicebox може да генерира говор претставник на различните разговори во реалниот свет, на шест јазици.

Ветувачка иднина за генеративна вештачка интелигенција

Воведувањето на Voicebox е критична пресвртница во генеративното истражување на вештачката интелигенција. Неговиот развој означува како се развива вештачката интелигенција, приближувајќи се до разбирањето и повторувањето на нијансите на човечката комуникација. Потенцијалните употреби на Voicebox се огромни, од подобрување на виртуелната комуникација до зајакнување на креаторите со пософистицирани алатки за уредување аудио, сè до рушење на јазичните бариери.

Сепак, иако можностите се возбудливи, неопходно е да се разгледаат и етичките импликации на таквата технологија. Способноста на моделите со вештачка интелигенција како Voicebox да имитираат индивидуални гласови покренува прашања за согласноста и приватноста. Како ќе се регулираат овие технологии за да се осигура дека тие се користат одговорно? Како ќе ги заштитиме гласовите на поединците од експлоатација или злоупотреба? Ова се предизвици со кои компаниите како Мета ќе мора да се справат додека генеративната вештачка интелигенција продолжува да напредува.

Voicebox е само почеток. Како што другите истражувачи се надоврзуваат на работата на Мета, иднината на аудио просторот и генеративното истражување на вештачката интелигенција носи многу ветувања и потенцијали. Ние сме на пропаст на новото доба во вештачката интелигенција, која продолжува да ги замаглува линиите помеѓу дигиталното и физичкото.

Поврзани теми:генерирање на говор

Следно

Обидот на Франција да стане центар за вештачка интелигенција во Европа: потенцијален предизвик за САД

Не ја пропуштајте

Вештачка интелигенција за подготвеност за пандемија: Дали модерните системи со вештачка интелигенција се подготвени за нова пандемија?

Алекс Мекфарланд

Алекс Мекфарланд е писател од Бразил кој ги покрива најновите случувања во вештачката интелигенција. Работел со врвни компании и публикации за вештачка интелигенција ширум светот.

Обединете се.AI

Мета го откри говорното сандаче за модел на говорна генерација

Вештачка интелигенција

Мета го откри говорното сандаче за модел на говорна генерација

Содржина

Разноврсни способности на Voicebox

Ветувачка иднина за генеративна вештачка интелигенција

Последни пораки

Обединете се.AI

Мета го откри говорното сандаче за модел на говорна генерација

Содржина

Разноврсни способности на Voicebox

Ветувачка иднина за генеративна вештачка интелигенција

Можеби ви се допаѓа

Последни пораки