Refresh

This website www.unite.ai/mn/stability-ai-unveils-stable-audio-2-0-empowering-creators-with-advanced-ai-generated-audio/ is currently offline. Cloudflare's Always Online™ shows a snapshot of this web page from the Internet Archive's Wayback Machine. To check for the live version, click Refresh.

stub Тогтвортой байдлын хиймэл оюун ухаан нь тогтвортой аудио 2.0-г танилцууллаа: Бүтээгчдийг хиймэл оюун ухаанаар боловсруулсан дэвшилтэт аудиогоор чадавхижуулж байна - Unite.AI
бидэнтэй хамт холбоно

Хиймэл оюун

Тогтвортой байдлын хиймэл оюун ухаан нь тогтвортой аудио 2.0-г танилцууллаа: Бүтээгчдийг хиймэл оюун ухаанаар үүсгэсэн дэвшилтэт аудиогоор чадавхжуулах

Нийтэлсэн

 on

Зураг: Тогтвортой байдлын AI

Тогтвортой байдлын хиймэл оюун ухаан нь нээлтээ хийснээр инновацийн хил хязгаарыг дахин давлаа Тогтвортой аудио 2.0. Энэхүү хамгийн сүүлийн үеийн загвар нь өмнөх үеийнхээ амжилтад тулгуурлан уран бүтээлчид болон хөгжимчдийн аудио контентыг бүтээх, удирдах аргад хувьсгал хийх амлалт өгөх олон шинэлэг шинж чанаруудыг нэвтрүүлсэн.

Тогтвортой Аудио 2.0 нь хиймэл оюун ухаанаар үүсгэгдсэн аудиог хөгжүүлэх чухал үе шат болж, чанар, олон талт байдал, бүтээлч чадамжийн шинэ стандартыг бий болгож байна. Энэхүү загвар нь бүрэн хэмжээний дуу үүсгэх, байгалийн хэл дээрх дууны түүврийг хувиргах, олон төрлийн дууны эффект гаргах чадвартай тул төрөл бүрийн салбар дахь контент бүтээгчдэд боломжуудын ертөнцийг нээж өгдөг.

Шинэлэг аудио шийдлүүдийн эрэлт өссөөр байгаа тул Stability AI-ийн хамгийн сүүлийн үеийн санал болгож буй бүтээгдэхүүн нь бүтээлч үр дүнгээ нэмэгдүүлэх, ажлын урсгалыг оновчтой болгохыг эрэлхийлж буй мэргэжилтнүүдэд зайлшгүй шаардлагатай хэрэгсэл болоход бэлэн байна. Тогтвортой Аудио 2.0 дэвшилтэт хиймэл оюун ухааны технологийн хүчийг ашигласнаар хэрэглэгчдэд хөгжмийн найруулга, дууны дизайн, аудио бичлэгийн дараах үйлдвэрлэлийн талаар урьд өмнө байгаагүй газар нутгийг судлах боломжийг олгодог.

Аудио-Аудио функцийн Демо

Тогтвортой Аудио 2.0-ийн гол онцлогууд юу вэ?

Тогтвортой Аудио 2.0 нь хиймэл оюун ухаанаар үүсгэгдсэн аудионы дүр төрхийг дахин тодорхойлж чадах гайхалтай олон төрлийн функцуудтай. Бүрэн хэмжээний дуу үүсгэхээс эхлээд аудио-аудио хувиргах, сайжруулсан дууны эффект үйлдвэрлэх, хэв маягийг шилжүүлэх хүртэл энэхүү загвар нь бүтээгчид өөрсдийн сонсголын алсын харааг бодит болгох цогц хэрэгслээр хангадаг.

Бүрэн хэмжээний зам үүсгэх

Тогтвортой Аудио 2.0 нь хиймэл оюун ухаанаар бүтээсэн бусад аудио загваруудаас гурван минутын урттай бүрэн хэмжээний дуу үүсгэх чадвараараа ялгардаг. Эдгээр зохиолууд нь зөвхөн өргөтгөсөн хэсгүүд биш, харин танилцуулга, хөгжүүлэлт, гаралт зэрэг тодорхой хэсгүүдийг багтаасан бүтэцтэй хэсгүүд юм. Энэ функц нь хэрэглэгчдэд уялдаа холбоотой өгүүлэмж, явцтай хөгжмийн бүрэн бүтээл гаргах боломжийг олгож, хиймэл оюун ухааны тусламжтайгаар хөгжим бүтээх боломжийг нэмэгдүүлнэ.

Нэмж дурдахад загвар нь стерео дууны эффектийг багтаасан бөгөөд үүссэн аудионы гүн, хэмжээсийг нэмдэг. Орон зайн элементүүдийг багтаасан нь дууны бодит байдал, шимтэх чанарыг улам сайжруулж, видео бичлэгийн арын хөгжимөөс эхлээд бие даасан хөгжмийн зохиол хүртэл өргөн хүрээний хэрэглээнд тохиромжтой болгодог.

Аудио-аудио үүсгэх

Stable Audio 2.0-ийн хамгийн сэтгэл хөдөлгөм нэмэлтүүдийн нэг бол аудио-аудио үүсгэх чадвар юм. Хэрэглэгчид одоо өөрсдийн дууны дээжийг байршуулж, байгалийн хэл дээрх сануулгыг ашиглан өөрчлөх боломжтой. Энэ онцлог нь уран бүтээлчид болон хөгжимчдөд урьд өмнө төсөөлж ч байгаагүй арга замаар дууны хувиргах, нөхөн сэргээх туршилт хийх боломжийг олгож, бүтээлч боломжуудын ертөнцийг нээж өгдөг.

Хэрэглэгчид хиймэл оюун ухааны хүчийг ашигласнаар одоо байгаа аудио хөрөнгийг өөрсдийн хэрэгцээнд нийцүүлэн өөрчлөх боломжтой. Тогтвортой Аудио 2.0 нь хөгжмийн зэмсгийн тембрийг өөрчлөх, дууны аяыг өөрчлөх, эсвэл одоо байгаа дээж дээр тулгуурлан цоо шинэ дуу авиа үүсгэх эсэхээс үл хамааран дууны хувиргалтыг судлах зөн совинтой арга юм.

Сайжруулсан дууны эффект үйлдвэрлэх

Тогтвортой Аудио 2.0 нь хөгжим үүсгэх чадвараас гадна олон төрлийн дууны эффектүүдийг бий болгоход онцгой юм. Навчны чимээ шуугиан, машин механизмын чимээ гэх мэт чимээ шуугианаас эхлээд хотын хөл хөдөлгөөн ихтэй гудамж, байгалийн орчин гэх мэт илүү сэтгэл хөдөлгөм, төвөгтэй дуу чимээ хүртэл олон төрлийн аудио элементүүдийг бий болгож чадна.

Энэхүү сайжруулсан дууны эффект үйлдвэрлэх онцлог нь кино, телевиз, видео тоглоом, мультимедиа төсөлд ажиллаж буй контент бүтээгчдэд онцгой ач холбогдолтой юм. Тогтвортой Аудио 2.0-ийн тусламжтайгаар хэрэглэгчид өндөр чанартай дууны эффектүүдийг хурдан бөгөөд хялбар үүсгэх боломжтой бөгөөд эс тэгвээс их хэмжээний ажил эсвэл үнэтэй лицензтэй хөрөнгө шаардагдана.

Загварын шилжүүлэг

Тогтвортой Аудио 2.0 нь хэрэглэгчдэд үүсгэсэн эсвэл байршуулсан аудионы гоо зүйн болон өнгө аясыг өөрчлөх боломжийг олгодог загвар дамжуулах функцийг нэвтрүүлсэн. Энэхүү чадвар нь бүтээгчид өөрсдийн төслийн тодорхой сэдэв, төрөл, сэтгэл хөдлөлийн өнгө аястай тааруулан аудио гаралтыг тохируулах боломжийг олгодог.

Загварын дамжуулалтыг ашигласнаар хэрэглэгчид өөр өөр хөгжмийн хэв маягийг туршиж үзэх, жанруудыг холих эсвэл цоо шинэ дууны палитр үүсгэх боломжтой. Энэ функц нь нэгдмэл дууны бичлэг үүсгэх, хөгжмийг тодорхой дүрслэлийн агуулгад тохируулан тохируулах, эсвэл бүтээлч эвлүүлэг, ремиксийг судлахад тустай.

Тогтвортой Аудио 2.0-ийн технологийн дэвшил

Хамгаалалтын дор Stable Audio 2.0 нь гайхалтай гүйцэтгэл, өндөр чанартай гаралтыг олгодог хамгийн сүүлийн үеийн AI технологиор тэжээгддэг. Загварын архитектур нь нарийн ширийн зүйлийг нарийн хянахын зэрэгцээ уялдаатай, бүрэн хэмжээний аудио найруулга үүсгэх өвөрмөц сорилтуудыг даван туулахын тулд нарийн боловсруулсан болно.

Далд тархалтын загварын архитектур

Тогтвортой Аудио 2.0-ийн цөм нь аудио үүсгэхэд оновчтой болсон далд тархалтын загварын архитектур юм. Энэхүү архитектур нь маш шахагдсан гэсэн хоёр үндсэн бүрэлдэхүүн хэсгээс бүрдэнэ автомат кодчилол болон диффузийн трансформатор (DiT).

Автомат кодлогч нь түүхий аудио долгионы хэлбэрийг авсаархан дүрслэл болгон үр дүнтэй шахах үүрэгтэй. Энэхүү шахалт нь загварт аудионы чухал шинж чанаруудыг олж авахын зэрэгцээ чухал ач холбогдол багатай нарийн ширийн зүйлийг шүүж, илүү уялдаатай, бүтэцтэй гаралтыг бий болгодог.

Stability AI-ийн цоо шинэ Stable Diffusion 3 загварт ашигласантай адил диффузын трансформатор нь өмнөх хувилбаруудад ашиглагдаж байсан уламжлалт U-Net архитектурыг орлодог. DiT нь өгөгдлийн урт дараалалтай харьцахдаа онцгой чадвартай тул уртасгасан аудио зохиолуудыг боловсруулах, үүсгэхэд тохиромжтой.

Гүйцэтгэл, чанар сайжирсан

Өндөр шахсан автомат кодлогч болон диффузийн трансформаторын хослол нь Stable Audio 2.0-д өмнөх хувилбартай харьцуулахад гүйцэтгэл болон гаралтын чанарт мэдэгдэхүйц сайжруулалт хийх боломжийг олгодог.

Автомат кодлогчийн үр ашигтай шахалт нь загварт дууг илүү хурдан боловсруулж, үүсгэх боломжийг олгодог бөгөөд шаардлагатай тооцооллын нөөцийг багасгаж, илүү өргөн хүрээний хэрэглэгчдэд хүртээмжтэй болгодог. Үүний зэрэгцээ диффузийн трансформаторын том хэмжээний бүтцийг таних, хуулбарлах чадвар нь үүсгэсэн аудио нь өндөр түвшний уялдаа холбоо, хөгжмийн бүрэн бүтэн байдлыг хангадаг.

Эдгээр технологийн дэвшлүүд нь бүрэн хэмжээний хөгжмийн найруулга, нарийн төвөгтэй дууны дүрс эсвэл нарийн дууны эффект гэх мэт гайхалтай бодитой, сэтгэл хөдлөлийн резонанстай аудиог бий болгож чадах загвараар төгсдөг. Тогтвортой Аудио 2.0-ийн архитектур нь хиймэл оюун ухаанаар үүсгэгдсэн аудионы ирээдүйн шинэчлэлийн үндэс суурийг тавьж, бүтээгчдэд илүү боловсронгуй, илэрхийлэлтэй хэрэгслүүдийг бий болгож байна.

Тогтвортой аудио 2.0-тэй зохиогчийн эрх

Хиймэл оюун ухаанаар үүсгэгдсэн аудио тасралтгүй хөгжиж, илүү хүртээмжтэй болж байгаа тул ёс зүйн үр дагаврыг шийдвэрлэх, бүтээгчдийн эрхийг хамгаалах нь маш чухал юм. Тогтвортой Аудио 2.0-ийг сургахад хувь нэмрээ оруулж буй уран бүтээлчдэд ёс зүйн хөгжлийг нэн тэргүүнд тавьж, шударга нөхөн олговор олгохын тулд Stability AI нь идэвхтэй алхмуудыг хийсэн.

Тогтвортой Аудио 2.0-ийг зөвхөн өндөр чанартай аудио контентын нэр хүндтэй эх сурвалж болох AudioSparx-ийн лицензтэй өгөгдлийн багц дээр сургасан. Энэхүү өгөгдлийн багц нь хөгжим, дууны эффект, нэг багажны иш зэрэг 800,000 гаруй аудио файл, харгалзах текст мета өгөгдлөөс бүрдэнэ. Лицензтэй өгөгдлийн багцыг ашигласнаар Тогтвортой байдлын AI нь уг загварыг хууль ёсны дагуу олж авсан, зохих ёсоор хамааруулсан аудио өгөгдөл дээр үндэслэсэн болохыг баталгаажуулдаг.

Зохиогчийн бие даасан байдлын ач холбогдлыг хүлээн зөвшөөрч, Stability AI нь бүтээл нь AudioSparx өгөгдлийн багцад багтсан бүх уран бүтээлчдэд Stable Audio 2.0-ийн сургалтанд дууг ашиглахаас татгалзах боломжийг олгосон. Энэхүү татгалзах механизм нь зохиогчдод өөрсдийн ажлыг хэрхэн ашиглахыг хянах боломжийг олгодог бөгөөд зөвхөн хиймэл оюун ухааны сургалтанд ашиглахад аудиог ашиглахад таатай хүмүүсийг мэдээллийн багцад оруулах боломжийг олгодог.

Тогтвортой Аудио 2.0-ийн хөгжилд хувь нэмрээ оруулж буй бүтээгчид хүчин чармайлтаа шударгаар нөхөн төлүүлэхийн тулд тогтвортой байдлын AI нь тууштай ажилладаг. AudioSparx өгөгдлийн багцыг лицензжүүлж, татгалзах сонголтоор хангаснаар тус компани хиймэл оюун ухаанаар үүсгэсэн аудионы тогтвортой, тэгш экосистемийг бий болгохын төлөө зүтгэж байгаагаа харуулж, бүтээгчид оруулсан хувь нэмрийг нь үнэлж, шагнаж урамшуулдаг.

Зохиогчийн эрхийг цаашид хамгаалах, зохиогчийн эрхийн зөрчлөөс урьдчилан сэргийлэхийн тулд Stability AI нь контент таних технологийн тэргүүлэгч Audible Magic-тэй хамтран ажиллаж байна. Audible Magic-ийн дэвшилтэт контент таних (ACR) системийг аудио байршуулах процесст нэгтгэснээр Stable Audio 2.0 нь зөрчилтэй байж болзошгүй агуулгыг тодорхойлж, тэмдэглэж, платформ дотор зөвхөн эх эсвэл зохих лицензтэй аудиог ашиглах боломжийг баталгаажуулдаг.

Эдгээр ёс суртахууны үүднээс авч үзэх, бүтээгч төвтэй санаачилгуудаар дамжуулан Тогтвортой байдлын AI нь аудио домэйнд хариуцлагатай хиймэл оюун ухааныг хөгжүүлэх хүчтэй үлгэр жишээг бий болгодог. Бүтээгчдийн эрхийг нэн тэргүүнд тавьж, өгөгдөл ашиглах, нөхөн олговор олгох тодорхой удирдамжийг бий болгосноор компани нь хиймэл оюун ухаан болон хүний ​​бүтээлч байдал зэрэгцэн оршиж, цэцэглэн хөгжих хамтын ажиллагаа, тогтвортой орчинг бүрдүүлдэг.

Тогтвортой AI ашиглан аудио бүтээлийн ирээдүйг бүрдүүлэх нь

Тогтвортой Аудио 2.0 нь хиймэл оюун ухаанаар үүсгэсэн аудионы чухал үе шатыг тэмдэглэж, хөгжим, дууны дизайн, аудио үйлдвэрлэлийн шинэ хил хязгаарыг судлах цогц хэрэгслээр бүтээгчдийг хүчирхэгжүүлдэг. Хамгийн сүүлийн үеийн далд тархалтын загварын архитектур, гайхалтай гүйцэтгэл, ёс суртахууны хэм хэмжээ, зохиогчийн эрхийг эрхэмлэдэг тул тогтвортой байдлын AI нь аудио бүтээлийн ирээдүйг тодорхойлоход тэргүүн эгнээнд явж байна. Энэхүү технологи хөгжихийн хэрээр хиймэл оюун ухаанаар үүсгэгдсэн аудио нь уран бүтээлчид болон хөгжимчдийг гар урлалынхаа хил хязгаарыг давж, дэлхийд юу боломжтойг дахин тодорхойлоход шаардлагатай хэрэгслээр хангаж, бүтээлч орчинд улам бүр чухал үүрэг гүйцэтгэх нь ойлгомжтой. дуу чимээний.

Алекс МакФарланд бол хиймэл оюун ухааны хамгийн сүүлийн үеийн хөгжлийг хамарсан технологийн зохиолч юм. Тэрээр дэлхийн өнцөг булан бүрт хиймэл оюун ухааны стартапууд болон хэвлэлүүдтэй хамтран ажиллаж байсан.