stub OpenAI төрөлд суурилсан хөгжим бүтээх шинэ хиймэл оюун ухааны программ бүтээжээ - Unite.AI
бидэнтэй хамт холбоно

Хиймэл оюун

OpenAI төрөлд тулгуурлан хөгжим бүтээх шинэ хиймэл оюун ухааны программ бүтээжээ

mm
шинэчлэгдсэн on

Бие даасан судалгааны байгууллага OpenAI саяхан үүсгэсэн хиймэл оюун ухааны шинэ хэлбэрийг гаргажээ Жукебокс, хөгжим үүсгэх чадвартайн улмаас ингэж нэрлэсэн. Jukebox AI нь багаж хэрэгсэл, тэр ч байтугай дууны үг зэрэг шинж чанарууд дээр тулгуурлан дуу гаргах чадвартай бөгөөд OpenAI судалгааны баг түүнийг шахсан аудио клип болон дууны үгийн янз бүрийн хэсгүүдэд сургах замаар хиймэл оюун ухааныг бүтээжээ.

TechCrunch шиг мэдээлсэн, OpenAI судлаачид загварт түүхий аудио клип ашиглан сургаж, загварт аудио үүсгэх чадварыг олгосон. Энэ нь ихэвчлэн "бэлэгдлийн хөгжим" (MIDI хөгжим гэх мэт) дээр тулгуурладаг хөгжим үүсгэх бусад программуудыг бий болгоход ашигладаг аргуудаас ялгаатай нь нот болон дууны давтамжийн талаарх мэдээлэл боловч бодит аудио байдаггүй. Судлаачдын баг загварт сургах, аудиог шахаж, мэдрэлийн сүлжээний тайлбарлах формат руу кодлохын тулд эвхэгддэг мэдрэлийн сүлжээг ашигласан. Дараа нь трансформаторыг шахсан аудио үүсгэхэд ашигласан бөгөөд өгөгдлийг аудио формат руу хөрвүүлэхийн тулд дээж авсан.

Jukebox-г бүтээхдээ OpenAI нь аудионы нарийн төвөгтэй, нягт шинж чанартай ажиллах аргыг бий болгох шаардлагатай болсон. Судлаачид аудиог илүү салангид, шингэцтэй хэсгүүдэд хувааж, дууг секундын 1/128-ийн урттай бит болгон хуваах замаар дууны тасралтгүй мөн чанарыг авч үзсэн. Зорилго нь дууг том хэсгүүдэд хуваах чадвартай хиймэл оюун ухааны загварыг бий болгох явдал байсан бөгөөд ингэснээр асуудал нь шийдэгдэх боломжгүй, гэхдээ загварууд дууны хэв маягийг сурч, тэр загварыг сэргээж чадахуйц жижиг бөгөөд нарийвчлалтай байв.

OpenAI-ийн ашигладаг техник нь компанийн үйлдвэрлэсэн хуучин хөгжмийн үеийн хиймэл оюун ухаантай зарим нэг нийтлэг шинж чанартай байдаг. MuseNet. MuseNet нь MIDI файлууд дээр бэлтгэгдсэн бөгөөд дууны ерөнхий аялгуунд анхаарлаа төвлөрүүлж, дууны үгийг гаргаж чаддаггүй байсан ч янз бүрийн хэв маягаар хөгжим үүсгэх чадвартай байв. Үүний эсрэгээр Jukebox нь хөгжмийг дагалдан дууны үгээ өөрөө бичиж чаддаг. Дууны үгийг OpenAI судлаачид "хамтран бичсэн" бөгөөд энэ нь загварыг тодорхой хэв маягаар дууны үг бүтээхэд чиглүүлдэг. Jukebox системийг LyricWiki-ээс хассан дууны үг дээр сургасан бөгөөд сургалтын өгөгдөл нь 1.2 сая дууны текст болон мета өгөгдлөөс бүрддэг.

Загварын дууны үгийн тухай ярихад судлаачид эхлээд дууны тодорхой хэсэг/хэсэгт тохирох текстийг шинжлэн, дууны үгийг ойролцоогоор дууны үргэлжлэх хугацаанд сунгасан энгийн эвристик аргыг ашиглахыг оролдсон. Энэхүү энгийн арга нь ерөнхийдөө сайн ажилласан боловч судлаачид дууны үг маш хурдан байх үед энэ нь эвдэрсэн болохыг олж мэдсэн. Энэ асуудлыг шийдэхийн тулд дуунаас хоолойнуудыг гаргаж аваад, дууны үгийн түвшний зохицлыг олж авахын тулд уянгын тексттэй нийцүүлсэн. Дараа нь дууны үгэнд кодчилолын давхаргыг ашигласан бөгөөд түлхүүр утгын хосыг ашиглан хөгжмийн хэсгүүдийг дууны үгэнд буулгасан анхаарлын төвшинг ашигласан. Үүний үр дүнд дууны үг, дуу хоолой нь нэлээд нарийн таарч байсан.

Зохиогчид нь цаас Jukebox-д хэд хэдэн хязгаарлалт байдаг бөгөөд цаашдын ажил нь хиймэл оюун ухааны чадварыг сайжруулахад чиглэх болно гэдгийг анхаарна уу. Зохиогчдын бичсэнчлэн блог шуудангаар:

“Jukebox нь хөгжмийн чанар, уялдаа холбоо, дууны дууны урт, уран бүтээлч, төрөл, дууны үгэнд тохируулах чадварын хувьд урагшлах алхамыг илэрхийлдэг ч эдгээр үеийнхэн болон хүний ​​бүтээсэн хөгжмийн хооронд ихээхэн ялгаа бий. Жишээлбэл, бүтээгдсэн дуунууд нь орон нутгийн хөгжмийн уялдаа холбоог харуулж, уламжлалт хөвчний хэв маягийг дагаж, гайхалтай гоцлол дууг гаргаж чаддаг ч бид дахин давтагдах найрал дуу гэх мэт илүү танил хөгжмийн бүтцийг сонсдоггүй."

Яг одоо загвар өмсөгч нь тодорхой жанр, тэр ч байтугай тодорхой уран бүтээлчийн хэв маягаар танигдахуйц дуу гаргах чадвартай. Жишээлбэл, Элвис Пресли, Кэти Перри, Уур хилэнгийн эсрэг дууны хэв маягаар дуу гаргах боломжтой. Хэдийгээр дуунууд нь аль нэг төрөлд багтах эсвэл дуучны хэв маягийн сэдэвтэй байдаг ч нэлээд бүдүүлэг бөгөөд ихэвчлэн элэглэл эсвэл дууны муу ковер хувилбар шиг сонсогддог. Гэсэн хэдий ч техникийн ололт амжилт нь гайхалтай юм. AI үүсгэх системийг бий болгох үүрэгтэй судлаачид даалгавар нь хэцүү байсан тул хөгжим үүсгэх чадвартай програм дээр ажиллахаар сонгосон бөгөөд судлаачид техникээ үргэлжлүүлэн сайжруулахаар төлөвлөж байна. Та зарим дууг сонсож болно энд.

Мэргэшсэн блоггер, программист Машины сургалт болон Гүн сурах сэдвүүд. Даниел бусад хүмүүст хиймэл оюун ухааны хүчийг нийгмийн сайн сайхны төлөө ашиглахад тусална гэж найдаж байна.