stub Sketch-ээс платформ руу: Google Genie-ийн тоглоом бүтээх уран сайхны хандлага - Unite.AI
бидэнтэй хамт холбоно

Хиймэл оюун

Sketch-ээс платформ руу: Google Genie-ийн тоглоом бүтээх уран сайхны хандлага

mm
шинэчлэгдсэн on
Google Genie-ийн хиймэл оюун ухааны ид шид нь нэг зураг эсвэл текстийг хэрхэн интерактив, тоглох боломжтой 2D ертөнц болгон хувиргадаг болохыг олж мэдээрэй.

Genie, гайхалтай бүтээл Google DeepMind, судлаачид болон тоглоомчдын төсөөллийг татсан. Бүтэн нэр нь "GENerative Interactive Environment" нь түүний ер бусын чадварыг илтгэнэ. Дунджаас ялгаатай AI загвар, Genie нь нэг зураг эсвэл текстийн сануулгыг интерактив, тоглох боломжтой 2D ертөнц болгон хувиргах онцгой хүчийг эзэмшдэг.

Genie нь шошгогүй интернет видеонуудаас мэдлэгийг өөртөө шингээж, виртуал ертөнцийг амилуулах чадвараараа бусдаас ялгардаг. Энэ нь янз бүрийн орчин, харилцан үйлчлэлийн нарийн ширийн зүйлийг шингээдэг дижитал хөвөнгийн үүрэг гүйцэтгэдэг.

Хамгийн гол нь Genie бол дэлхийн суурь загвар юм мэдрэлийн архитектур хамтран 11 тэрбум параметр. Түүний салшгүй бүрэлдэхүүн хэсгүүд, тухайлбал Орон зайн цаг хугацааны видео токенизатор, Авторегрессив динамик загвар, мөн шийдвэрлэх ач холбогдолтой Далд үйлдлийн загвар, хэрэглэгчдэд хялбархан оролцох боломжтой орчинг бүрдүүлэхийн тулд эв найртай ажиллана.

Genie нь нуугдмал эрдэнэс бүхий баялаг ойгоос залуу уран бүтээлчдийн зурааснаас санаа авсан уран зөгнөлт тоглоомын түвшинд шилжих чухал чадварыг харуулж байна. Энэ нь тусгай үйлдлийн шошго, домэйны тусгай шаардлагагүйгээр хамтран суралцаж, өргөн цар хүрээтэй, хязгааргүй бүтээлч туршлагыг санал болгодог тул онцгой хувирах чадварыг харуулдаг.

Genie хэрхэн ажилладаг вэ?

Genie-ийн сэтгэл татам ертөнцөд статик зургууд нь уран сайхны ур чадвар, тооцоолох ур чадварыг хослуулснаар динамик, интерактив үзэгдэл болж хувирдаг. Эдгээр хөдөлгөөнгүй зургуудыг өөр ертөнцийн видеон доторх жаазууд болгон төсөөлөөд үз дээ, тус бүр нь уламжлалт тойм зургаас хальж, сэтгэл татам шинэ үзэгдлүүдийг нээнэ.

Genie-ийн гол цөм нь видеонд суурилсан арга барилд оршдог бөгөөд анхны зургуудыг сэтгэл татам флипбүүкийн жааз мэт авч үздэг. Энэ нь амьдралыг тойм зурагт гайхалтай байдлаар авчирдаг. Жишээлбэл, цайзын энгийн зураг нь далд танхим, нууц гарц, өндөр цамхаг бүхий өргөн цайз болж хувирдаг. Үүний нэгэн адил муруй шугам нь хөдөлгөөнт загас, адал явдалт хөвөгч тавцан бүхий ороомог гол болон хувирч болно. Genie-ийн видеонд суурилсан арга зүй нь төсөөлөл, бодит байдлыг хослуулж, хэрэглэгчдийг гайхалтай ертөнцөд урьж байна.

Жинигийн ид шидийн чадвар нь түүний хатуу бэлтгэлээс үүдэлтэй. Энэ нь асар их цуглуулгаас санаа авсан 200,000 цаг олон нийтэд нээлттэй 2D платформ тоглоомын онлайн видеонуудын . Genie энэ эрдэнэсийн сангаас олон зуун 30,000D тоглоомуудаас 2 цагийн стандартчилсан видео бичлэгийг нямбай сонгож авсан. Тоглоомын эдгээр туршлага нь пикселийн адал явдал, нарийн үсрэлт, тоглоомын дүрүүдийн сүнсээр шингэсэн Genie-ийн зураг болсон.

Видео тоглоом шиг Genie шидтэн шиг интерактив үйлдлүүдийг урьдчилан таамаглаж, үүсгэж чаддаг. Тоглоомын хянагч дээрх товчлууруудыг дарж байна гэж төсөөлөөд үз дээ—Genie үүнтэй төстэй зүйл хийдэг. Энэ нь статик элементүүдийг авдаг (мод шиг) мөн ид шидээр тэдгээрийг динамик шинж чанар болгон хувиргадаг. Жишээлбэл, "up” нь хөдөлгөөнгүй модыг сэгсэрдэг навчтай, авирах боломжтой усан үзмийн мод болгон хувиргаж чадна. Мөн дүрүүд аюултай цоорхойг даван гарах шаардлагатай үед Genie тэдний пикселийн хөдөлгөөнийг зоригтойгоор хөдөлгөдөг. Бид үүнийг жинхэнэ ертөнц болон ид шидийн ертөнцийн хооронд Genie бүжиглэж, бүх зүйлийг амьд болгодог шиг төсөөлж чадна.

Genie болор бөмбөлөг шиг ажиллаж, дараагийн үйлдлийг урьдчилан таамаглах загвараа ашиглана. Энэ нь санамсаргүй фрэймүүд болон боломжит үйлдлүүдийг харж, дараах зургийн талаар мэдлэгтэй таамаглал дэвшүүлдэг. Энэ нь киног хэрхэн засварлаж, зураг авалт бүрийг дараагийнх руу хөтөлж, урсгал, түгшүүр, сэтгэл хөдөлгөм түүхийг бүтээдэгтэй төстэй юм. Жэнигийн таамаглал биелэх тусам хөдөлгөөнгүй зургуудаар эхэлсэн зүйлс сэтгэл хөдөлгөм, сэтгэл хөдөлгөм дүр зураг болж хувирдаг.

Genie-ийн уран сайхны боломж

Жэнигийн уран сайхны ур чадвар нь хүүхдийн doodle-г амьд ертөнц болгон хувиргахтай адил гайхалтай юм. Цаасан дээрх хэдэн мөр нь судлах зүйлс, даван туулах сорилтууд, сонирхолтой дүрүүд бүхий сэтгэл хөдөлгөм адал явдал болж хувирч байгааг төсөөлөөд үз дээ.

Түүхчдийн хувьд Genie хэд хэдэн сонголтыг санал болгодог. Жишээлбэл, нэг зургийн сануулга нь тоглогчид түүхийг олж, нууцыг тайлж чадах бүхэл бүтэн тоглоомын ертөнцийг бий болгож чадна. Энэ нь өгүүлэгчийн төсөөлж буйгаар дэлгэхэд бэлэн болсон харааны түүхтэй адил юм.

Нэмж дурдахад, Genie зөвхөн тоглоом биш юм; Энэ нь уран бүтээлчид болон түүхчдэд зориулсан олон талын хэрэгсэл бөгөөд энгийн санаануудыг өнгөрсөн ба одоог холбосон интерактив туршлага болгон хувиргадаг.

Genie-ийн хувиргах програмууд

Genie-ийн сэтгэл татам чадварууд нь хэрэглээний шинэ эрин үеийг бий болгож чадна. Хэд хэдэн хэрэглээний домэйнууд дараах байдалтай байна:

Genie бол үндсэн санаагаа нарийвчилсан 2D тоглоом болгон хувиргаж эцэс төгсгөлгүй бүтээлч байдлыг бий болгодог ид шидийн сүнслэг нөлөө юм. Хүүхдийн зурсан зураг, бичмэл заавар нь гайхалтай адал явдал, харь гаригийн уран сэтгэмжийн газруудын эхлэлийг тавьж, уран сэтгэмжийн өргөн ертөнцтэй танилцахад урам зориг өгсөн.

Тоглоомоос гадна Genie-ийн гол чадвар бол хувьсгал хийх нууцыг агуулсан дэлхийн загварчлалд оршдог. машин суралцах. Бид үүнийг пикселийн замаар өөрөө жолооддог машинуудыг чиглүүлэх эсвэл эмч нарыг эмнэлгийн загварчлалд сургахад хэрэгтэй динамик үзэгдлүүдийг урьдчилан таамаглаж байна гэж төсөөлж магадгүй юм.

Genie-ийн ид шид нь зөвхөн тоглоом биш юм; Энэ нь сурах, урлагт бас тусалдаг. Хугацаа нь өөр өөр цаг үед интерактив аялал болж хувирдаг тул түүхийн хичээлүүд сэтгэл хөдөлгөм адал явдал болж чадна. Уран зургийн галерейд Genie-ийн пикселжүүлсэн бүтээлүүд ердийн зургийн хажууд өлгөөтэй байж, бүтээлч байдлын санааг хольж болно.

Сорилт ба ирээдүйн чиг хандлага

Гайхалтай шинж чанаруудаас гадна Genie зарим бэрхшээлтэй тулгардаг. Бүх зүйл сайхан харагдаж, тогтвортой байх нь жонглёр хийх, сараачсан бичээсийг шилдэг бүтээл болгон хувиргахтай адил боловч зөв тэнцвэрийг олоход хэцүү байдаг. Тиймээс Жени хөгжилтэй эмх замбараагүй байдлыг сайтар төлөвлөхтэй хэрхэн холихыг шийдэх ёстой.

Үүний нэгэн адил, тоглоомыг тоглогчдод тоглоход тохиромжтой болгох нь хэцүү байдаг. Хэрэв тэд хэтэрхий хялбар бол тэд хөгжилтэй биш байж магадгүй юм; Хэрэв тэд хэтэрхий хэцүү бол тоглогчид бууж өгч магадгүй юм. Тиймээс Genie тоглоом зохион бүтээгч шиг байх ёстой бөгөөд дүрүүд хэрхэн өндөр үсэрч, дайснууд хаана гарч ирэх, хаана хүчирхэгждэг болохыг тохируулдаг.

Genie-ийн ид шид тархах тусам зарим асуултууд гарч ирдэг. Жишээлбэл, Genie-ийн бүтээсэн тоглоомын хувьд хэн гавьяат байх ёстой вэ? Анхны санаа өгөгч үү, түүнд амьдралыг авчирдаг шидэт загвар уу, эсвэл виртуал ертөнцөд өөрийгөө шимтэн үздэг тоглогч уу? Жини эдгээр асуултуудыг ухаалгаар удирдаж, тоглоомыг хэн эзэмшдэг, түүний санаануудыг шийдэх ёстой.

Доод шугам

Эцэст нь, Genie, Google DeepMind-ийн шинэлэг бүтээл нь хувиргах хүчээрээ уламжлалт хиймэл оюун ухааны загваруудыг давж гардаг. Сайжруулсан тоглоомын туршлагаас эхлээд машин сурахад хувьсгал хийх, янз бүрийн салбарт бүтээлч байдлыг дэмжих хүртэл Genie олон талт хүч болж гарч ирсэн.

Сорилтуудтай тулгарсан ч гэсэн урьдчилан таамаглах динамик, уран сайхны чадавхид зориулсан өвөрмөц арга барил нь төсөөлөл, технологи нь хоорондоо уялдаатай холилдох ирээдүйн замыг нээж, интерактив эрэл хайгуул, бүтээлч байдлын сонирхолтой замыг нээж өгдөг.

Доктор Асад Аббас, А Эрхэлсэн дэд профессор Пакистаны Исламабад улсын COMSATS их сургуульд докторын зэрэг хамгаалсан. АНУ-ын Хойд Дакота мужийн их сургуулиас. Түүний судалгаа нь үүл, манан, захын тооцоолол, том өгөгдлийн аналитик, хиймэл оюун ухаан зэрэг дэвшилтэт технологид төвлөрдөг. Доктор Аббас нэр хүндтэй шинжлэх ухааны сэтгүүл, бага хуралд нийтлүүлсэн бүтээлээрээ ихээхэн хувь нэмэр оруулсан.