стуб Овладавање АИ уметношћу: сажети водич за средње путовање и брзи инжењеринг - Уните.АИ
Повежите се са нама

Промпт Енгинееринг

Овладавање АИ уметношћу: сажети водич кроз пут и брзо инжењерство

mm
Ажурирано on
Током путовања генерисан УНИТЕ АИ ЛОГО

Увод у МидЈоурнеи генерисану уметност

АИ брзо пробија баријере немогућег и недавно је напао домен уметности, трансформишући га у потпуности. Сада, не морате бити мајстор или стручњак за Пхотосхоп да бисте оживјели плодове своје маште. Једноставан, добро артикулисан упит је све што вам треба, захваљујући Мидјоурнеи.

Све је почело увођењем револуционарних технологија као што су ДАЛЛ-Е, Мидјоурнеи и СтаблеДиффусион још 2022. Док је свака од ових иновација унела свој посебан додир на платну Генеративне АИ, Мидјоурнеи је, посебно, наставио своје убедљиво путовање, чинећи запажених корака.

Мидјоурнеи је тренутно водећи АИ генератор високе резолуције од текста до слике на тржишту и истиче се својом јединственом мешавином генерисања текста у слику, уређивања и повећања садржаја медија, као и активног приступа уметничкој заједници, све почев од 10 долара по месец дана. Овај свеобухватни скуп функција представља узбудљиво платно подједнако за уметнике, ентузијасте у технологији и професионалце за вештачку интелигенцију, изграђујући окружење за креативност и иновације.

Свет уметности свакако прима пажњу, а предвиђа се да ће генеративна вештачка интелигенција на тржишту уметности бити сведок запањујућег раста КСНУМКС% ЦАГР. Мидјоурнеи је без премца у прављењу најреалистичнијих и најквалитетнијих визуелних приказа помоћу вештачке интелигенције.

Ефективни брзи инжењеринг иде даље од пуког стварања; обухвата најбоље праксе. Упутства треба да понуде јасноћу и да буду сажета, али да АИ дају довољно упутстава без претераног рецепта. Такође, циљна публика се мора узети у обзир током дизајна, узимајући у обзир варијабле као што су старост, пол и културна позадина, између осталог.

Како функционише МидЈоурнеи?

Мид-Јоурнеи користи две нове технологије машинског учења – велики језик и моделе дифузије. Језички модел, сличан АИ цхатботовима као што је ЦхатГПТ, помаже усред путовања у тумачењу значења ваших упита и претварању их у векторе. Овај вектор затим води процес дифузије.

Унутрашњи рад Мидјоурнеиа је углавном неоткривен. Ипак, очигледно је да користи генерисање текста у слику из две релативно нове технологије машинског учења: великих језичких модела и модела дифузије. Први је можда познат корисницима АИ платформи као што је ЦхатГПТ, а други је обећавајући додатак сектору АИ уметности. Цео систем се ослања на ЦЛИП скуп података за обуку, који се може наћи на ОпенАИ-овој истраживачкој страници.

Упркос ограниченим информацијама, могуће је скицирати широку слику Мидјоурнеи-а модел дифузије, прикладно назван 'Стабле Диффусион'. У суштини, Стабле Диффусион је модел отвореног кода који вешто трансформише текстуалне упите у слике различитих стилова и садржаја. Ова софистицирана процедура се постиже кроз модел дифузије, генеративни модел који премошћује зависности између текстуалних улаза и излаза слике.

Дифузиони модели су изграђени на темељу методе деноисинг Диффусион, приступа на који утиче неравнотежна термодинамика. Овај метод систематски демонтира структуру података и касније је обнавља. Овај приступ је прилагођен за генерисање слике од стране Хо ет ал. 2020. године, што је довело до настанка модела дифузије које видимо данас.

Модели дифузије обуке укључују две примарне фазе. У почетку, процес напред или дифузије укључује инкрементално додавање насумичне буке улазној слици све док се потпуно не претвори у шум. Овим процесом управља фиксни Марковљев ланац, који доследно додаје Гаусов шум у неколико узастопних корака.

Демонстрација рада на путу

Након тога, у фази реверзне или реконструкције, модел враћа оригиналне податке из стања у коме доминира бука постигнутог у процесу дифузије. Овај процес је вођен Марковљевим ланцем са наученим Гаусовим прелазима, што имплицира да се предвиђање густине вероватноће у било ком тренутку ослања искључиво на стање постигнуто у претходном временском кораку. Како латентни 'к1, …, кТ' деле исту димензионалност као и подаци, дифузиони модели се класификују као модели латентне променљиве.

Цена и претплата усред путовања

Док многи цхат ботови као што су ЦхатГПТ и Бинг Цхат нуде скоро неограничено коришћење бесплатно, сценарио се разликује за генераторе слика као што је Мид-Јоурнеи. Због значајне рачунарске снаге која је потребна, посебно од графичких процесорских јединица (ГПУ) и коришћења видео меморије за процес смањења шума, услуга Мид-Јоурнеи долази са цедуља са ценом.

Основни план почиње од 10 УСД месечно, пружајући око 3.3 сата ГПУ времена, довољно за приближно 200 генерација слика. Међутим, постоје виши планови који нуде неограничене слике у опуштеном режиму, иако са дужим временом чекања.

Подешавање вашег МидЈоурнеи

  1. Почевши од МидЈоурнеи укључује пријављивање на њихову званичну веб страницу, претплату на план, а затим преусмеравање на Дисцорд.
  2. Када лоцирате канал Мид-Јоурнеи на Дискорд, идите до Групе новопридошлих на левој страни. Одатле можете посматрати друге кориснике како креирају упите, научити механику Мид-Јоурнеи-а и комуницирати у ужурбаном окружењу.
  3. Након што се упознате са окружењем, позовите бота на ваш приватни сервер да неометано креира слике. Бот генерише четири слике за преглед на основу вашег упита, омогућавајући вам да одаберете најближу оригиналну идеју и додатно прецизирате слику.

Брза структура за средње путовање

  1. Команда /имагине на дисцорд каналу унутар Мидјоурнеи канала генерише јединствену слику из кратког текстуалног описа (Промпт).
  2. Да бисте поново креирали одређени стил на различитим сликама, једноставно унесите УРЛ слике поред текстуалног упита. Ваши нови, конзистентни резултати ће спојити елементе из одабране слике и текста.
    /имагине хттп://линк-то-иоур-имаге –параметар1 –параметар2
    Можете да генеришете везу до своје слике тако што ћете је отпремити на Дисцорд канал. Када је отпремљена, кликните десним тастером миша на слику и изаберите „Копирај везу“.
    Овде хттп://линк-то-иоур-имаге и параметри су опциони.
  3. Након овога, бот почиње да ради на вашој слици, и треба му отприлике минут да понуди четири алтернативе. Овај процес укључује употребу робусних графичких процесорских јединица (ГПУ) за обраду и тумачење сваког упита.
  4. Пратите употребу ГПУ-а помоћу команде /инфо. Омогућава вам да проверите своје 'Брзо преостало време' и надгледате ГПУ време ваше претплате.

/инфо промпт мидјоурнеи

Повећање и измене слике

За префињенију слику, користите дугмад 'У' испод слика да бисте повећали жељени избор. Такође можете да користите дугмад 'В' да извршите подешавања на одређеним сликама. За даље измене на увећаној слици, користите опције „Направи варијације“, „Поновно поправљање светле веће величине“ и „Поновно поновљено бета повећање“. Дугме 'Веб' вам омогућава да видите слику у већој величини у посебном прозору.

Мидјоурнеи омогућава повећање слике на резолуцију од 2048×2048 (квадрат) и 2720×1530 (широки екран) преко своје бета функције понављања повећања, са подразумеваном величином мреже генерације од 1024×1024 (квадрат) и 1456×816 (широки екран). Свака слика се може додатно побољшати кроз опције „У“ увећања, које побољшавају одређене делове слике.

Погледајте овај упит који производи фантастична уметничка дела са верзијом Мидјоурнеи В5.2.

/имагине Артворк приказује усамљено дрво под звезданим небом, са дететом које чита испод, у нијансама спокојне плаве и топле наранџе, инспирисано потезима француског импресионизма, персијским минијатурама, Баухаус једноставношћу, евокацијом класичних илустрација дечијих бајки, постизање асиметричне хармоније, изражене у заносном, народном/наивном: –ар 15:19 –упбета –к 2

Пример Водича за брзе информације током путовања

Креирајте своју прву умјетну интелигенцију на средњем путу

  1. Израда основног плана: Замислите себе као уметника. Започните једноставним, живописним описом слике коју желите да оживите. Наведите главни предмет, амбијент или чак ситне детаље које желите да уградите. Користите интерпункцију као што су зарези, заграде и цртице да структурирате своје мисли. За побољшане резултате, изричите контекст и детаље вашег дизајна. Елементи као што су субјект (нпр. Змај, стари аутомобил, Абрахам Линколн), медиј (нпр. дигитална уметност, скица оловком), окружење (нпр. свемир, под водом, ужурбани град), осветљење (нпр. меко, неонско, позадинско осветљење) , боја (нпр. земљани тонови, живописни, пригушени), расположење (нпр. меланхолично, ћудљиво, мирно) и композиција (нпр. пејзаж, крупни план, широкоугаони) могу бити критични. Примери:
    • Идилична шума окупана сунчевом светлошћу, пешачка стаза која вијуга у даљину
    • Град који никада не спава, са неонским светлима која се рефлектују од тротоара и разноликом гомилом
  2. Инфузија стила и кључних речи: Мидјоурнеијева АИ је способна да илуструје слике у безброј стилова као што су апстрактни, надреални или реалистични. Интеграцијом стила или сродних кључних речи, можете водити АИ да креира слику која одражава вашу визију. Експериментишите са различитим стиловима и кључним речима да бисте открили савршену мешавину. Примери:
    • Пејзажна слика која приказује пустињу у зору, која одражава стил Џорџије О'Киф, са пастелном палетом боја и органским облицима.
    • Апстрактни приказ мирне шуме, са геометријским шарама који формирају дрвеће и лишће, инспирисан композицијама Пиета Мондријана.
  3. Искористите напредна подешавања: Размотрите Мидјоурнеи као своју креативну кутију са алаткама, препуну напредних подешавања која вам омогућавају да фино подесите своје генерисане слике. То је као да рукујете магичним штапићем који вам омогућава да дочарате идеалну равнотежу случајности, стилизације и варијације слике. Ослободите своју креативну снагу петљајући по овим поставкама док не пронађете савршену комбинацију која одговара вашој визији. Примери:
    • Спокојна јапанска башта са језерцем који одражава дрвеће трешњиног цвета – семе 22 –с 150 –ц 40
    • Дистопијски сајберпанк град, осветљен неонским светлима – семе 88 –с 600 –ц 60
  4. Истицање елемената са тежинама: Визуелизујте своју слику као симфонију, са сваким елементом који доприноси великом ансамблу. Користећи ознаку „::“, можете диктирати значај различитих елемената на вашој слици, што вам омогућава да контролишете рефлекторе. Примери:
    • [Елегантан паун]::3 који седи на [дрвету глициније]::1 цвета живописним цвећем
    • [Величанствени слон]::2 ужива у сјају [залазећег сунца]::1 у савани
  5. Путовање је процес покушаја и грешака: експериментисање са различитим елементима и карактеристикама је неопходно. Свака итерација ће вас приближити слици коју сте замислили да оживите.

Параметри средине путовања

Модел Мидјоурнеи функционише коришћењем подесивих параметара који контролишу исход процеса генерисања слике. Ови параметри омогућавају корисницима да подесе и прилагоде своју генерисану уметност, фино подешавајући модел како би креирали излазе који савршено одговарају њиховом циљу.

Испод су основни и напредни параметри, њихове функције и како их користити да бисте у потпуности искористили Мидјоурнеи могућности:

  • Аспецт Ратиос (–аспецт ор –ар): Овај параметар контролише однос између ширине и висине генерисане слике. На пример, однос 16:9 је савршен за ИоуТубе сличице, док 1:1 даје квадратну слику сјајну за Инстаграм.
  • Хаос (–хаос): Овај параметар прилагођава разноликост почетне мреже слике и креће се од 0 до 100. Више вредности хаоса ће вам дати непредвидиве и јединствене резултате, док ће ниже вредности обезбедити конзистентније резултате.
  • Не (–не): Овај параметар вам помаже да елиминишете одређене елементе или карактеристике из генерисане слике. На пример, ако желите слику без црвене боје, можете користити „-без црвене“.
  • Квалитет (–квалитет или –к): Ово подешавање прилагођава време потребно за генерисање слике. Виши квалитет захтева више времена обраде, али даје сложене детаље. Овај параметар може да поприми вредности од .25, .5, 1 или 2.
  • Сеед (–сеед): Овај параметар одређује почетни визуелни шум, који делује као основна линија за генерисану слику. Коришћење истог броја семена са истим промптом ће дати сличне резултате. Прихвата целобројне вредности између 0–4294967295.
  • Стоп (–стоп): Са овим параметром, можете прерано прекинути посао, производећи мање детаљне, али потенцијално занимљиве резултате. Опсег је 10-100. На пример, ако наведете '–стоп 50', процес генерисања слике ће се зауставити на 50% завршетка, што ће резултирати мање детаљном, можда апстрактном сликом.
  • Стилизуј (–стилизуј или –с): Ово контролише ниво уметничке примене на генерисаној слици. Ниже вредности стилизације дају резултате ближе почетном упиту, док веће вредности резултирају апстрактнијим и уметничким интерпретацијама. У в5, подразумевана вредност је 100, али можете да је поставите било где од 0-1000.
  • Верзија модела: Можете бирати између различитих верзија Мидјоурнеи модела користећи параметар –версион или –в.
  • Ниџи: модел специјализован за слике у аниме стилу. Може се приступити помоћу параметра –нији.
  • Хигхми дефиниција: За апстрактне и пејзажне слике, параметар –хд активира рану верзију модела која даје веће, мање конзистентне слике.
  • Тест модели: Мидјоурнеи нуди посебне моделе за специфичне случајеве употребе. –тест и –тестп активирају стандардне и тест моделе фокусиране на фотографију.
  • Упсцалер: Алгоритам Мидјоурнеи почиње са мрежом слике ниске резолуције. Нуди неколико модела за повећање величине за побољшање величине и детаља слике.
    • Уплигхт: Алтернативни алат за повећање осветљења (–уплигхт) пружа увећане слике које су мање детаљне, али глаткије.
    • Упбета: Параметар –упбета води до слика са знатно мање додатних детаља, остајући ближе оригиналној слици мреже.
    • Упаниме: –упаниме упсцалер је дизајниран посебно за рад са –нији Мидјоурнеи моделом.
  • Тежина слике: Користите –ив да бисте подесили тежину упита за слику у односу на тежину текста. Подразумевана вредност је 0.25.
  • Самесеед: Параметар –самесеед осигурава да све слике у почетној мрежи користе исти почетни шум, стварајући веома сличне генерисане слике.
  • Видео: Мидјоурнеи може да сачува видео снимак напретка почетног процеса генерисања мреже слике помоћу параметра –видео.
  • Креативно: Са параметром –цреативе, тест и тестп модели дају разноврсније и креативније слике.

Мидјоурнеи доследно објављује ажурирања ради побољшања корисничког искуства, а последња је верзија 5.2, која је лансирана у јуну 2023. Додавањем –в 5.2 вашем промпту или избором преко команде /сеттингс, корисници могу да приступе овом напредном моделу. Верзија 5.2 нуди врхунске детаље слике и интуитивније разуме упите, доносећи светлије боје и побољшане композиције.

Разумевање ауторских права за уметничка дела генерисана вештачком интелигенцијом

Мидјоурнеи Слика мешавине вештачке интелигенције и закона о ауторским правима

У марту 2023, Америчка канцеларија за ауторска права је разјаснила свој став о ауторским правима Радови генерисани вештачком интелигенцијом. У политици се наводи да иако елементи које је направио човек у креацијама вештачке интелигенције (као што су списи или јединствени дизајни) могу бити заштићени, слике произведене вештачком интелигенцијом не испуњавају услове за ауторска права, поштујући глобалне норме да само људска креација испуњавају услове за заштиту ауторских права.

У контексту уметности вештачке интелигенције, ауторска права нису једноставна. Док дигитална уметност има допринос људског уметника, уметност генерисана вештачком интелигенцијом се ствара без директне људске интервенције, што компликује питање ауторства и власништва. Према Уреду за ауторска права САД, почетно власништво се додељује аутору дела – човеку. Међутим, пошто се АИ не може сматрати аутором, уметности генерисаној вештачком интелигенцијом недостаје јасно власништво.

Најновије смернице Канцеларије за ауторска права САД дозвољавају заштиту ауторских права на АИ уметност само када садржи довољно људског ауторства. Ниво 'довољног људског ауторства' остаје недефинисан и зависи од степена људске укључености у креирање уметничког дела вештачке интелигенције.

Занимљиво је да је Мидјоурнеи, платформа за креирање слика заснована на вештачкој интелигенцији, успоставила сопствене политике за права коришћења. Корисници бесплатног пробног периода могу да користе слике у некомерцијалне сврхе под међународном лиценцом Цреативе Цоммонс Аттрибутион-НонЦоммерциал 4.0 (ЦЦ БИ-НЦ 4.0), уз одговарајуће признање Мидјоурнеи. Међутим, претплатници који плаћају могу користити слике у било коју сврху, укључујући комерцијалну, под Општим комерцијалним условима. Овај развој у области ауторских права представља интригантну динамику између вештачке интелигенције и људске креативности.

Коришћење Мидјоурнеиа за динамички дизајн корисничког интерфејса и креативно генерисање логотипа

Од дизајнирања интуитивних корисничких интерфејса за веб локације или мобилне апликације до прављења јединствених логотипа и банера, Мидјоурнеи оснажује креаторе садржаја генеришући низ алтернатива дизајна у року од неколико секунди.

Ево како то функционише. Сваки дизајн почиње упитом, који служи као нацрт који АИ треба да прати. Претпоставимо да дизајнирате кориснички интерфејс за апликацију платформе за онлајн подучавање. Типичан упит би могао бити: „/имагине корисничко сучеље платформе за онлине подучавање, Дрибббле, висока резолуција, 4К, попут кхан академије“.

Почетни исходи можда неће савршено погодити циљ. На пример, додавање „Адобе КСД“ у микс може помоћи Мидјоурнеију да скроји своје дизајне тако да буду компатибилнији са Адобе КСД. Оптимизовани упит ће бити:

/имагине платформа за подучавање на мрежи, кориснички интерфејс, Адобе КСД, Дрибббле, висока резолуција, 4К, минималистички дизајн

Слика за време путовања дизајна корисничког интерфејса/УКС апликација за стоне рачунаре

 

Текстом инспирисан логотип или банере користећи Мидјоурнеи

Хајде да истражимо како да направимо банер са логотипом за УНИТЕ АИ.

Прво, морате имати једноставну слику текста који желите да прикажете. Ово можете креирати користећи било који алат за графички дизајн или уређивач текста и отпремити га на свој Дисцорд канал.

пример текста за УНИТЕ ЛОГО
Једноставна слика текста која се користи за креирање УНИТЕ логотипа

Промпт за креирање банера је:

/имагине Писма: УНИТЕ у футуристичком логотипу фонтова инспирисаног вештачком интелигенцијом са словима УНИТЕ –в 5 –ар 16:9

Екран са функцијама водича за време путовања

Погледајте ове примере упутства за више идеја:

/замислите усамљеног музичара који изводи спокојну мелодију на плутајућем граду у сумрак, у стилу арт ноувеау

Упутни водич за време путовања: Слика индијске уметности

 

/имагине Слика будуће особе која ради на футуристичком столу, окружена холографским екранима и напредном технологијом. Особа носи елегантан, сребрни комбинезон и на себи има наочаре за виртуелну стварност. Окружење је испуњено неонским светлима и плутајућим холограмима. Атмосфера је футуристичка и високотехнолошка, са осећајем узбуђења и иновације. Камера је дигитална камера високе резолуције, која прецизно бележи сваки детаљ. Уметнички стил је мешавина сајберпанка и минимализма, са фокусом на чисте линије и смеле боје. Редитељи, сниматељи, фотографи, модни дизајнери, карикатуристи и уметници који сарађују у овој јединственој јукстапозицији су Кристофер Нолан, Роџер Дикинс, Ени Лајбовиц, Виргил Абло, Хајао Мијазаки и Кавс.

Упута на путу за будућу особу која ради

/замислите 1940-те – стил Барбие као ратне медицинске сестре, у старој војној болници, негује рањене војнике, у стилу класичних Маттел илустрација, са атмосфером фотографије из Другог светског рата у сепији 8к –в 5 –ар 16 :9

Водич за брзе информације током путовања: Слика Барбие у јединственим поставкама

/замислите Оквир жене наслоњене на сајберпанк, лебдећи бицикл, јапански аниме, пространи градски пејзажи, 32к, замршен космодром, пролазан, панораме небодера, елегантан

Мидјоурнеи Слика девојке у стилу сајберпанка

 

Завршне мисли: Кретање кроз свет уметности вештачке интелигенције уз помоћ Мидјоурнеи

Запамтите: „Слика вреди хиљаду речи“. Детаљан, живописан опис може учинити чуда. Да, Мидјоурнеи није бесплатан за коришћење. Ипак, он револуционише свет уметности и проширује наше креативне могућности кроз своју најсавременију АИ технологију претварања текста у слику. Са могућношћу да конвертујете једноставан текстуални упит у слику високе резолуције, то је алатка која обећава безграничне могућности, не само за уметнике, већ и за УИ/УКС дизајнере, ентузијасте у технологији и професионалце за вештачку интелигенцију.

Ево неколико основних ствари које треба запамтити док се упуштате у авантуру на средњем путу:

  • Научите основе Мидјоурнеи промпт-а: Користите јасне, сажете и свеобухватне описе који обухватају вашу визију да бисте ефикасно водили АИ. Не заборавите да узмете у обзир своју публику и не оклевајте да експериментишете са различитим стиловима, расположењима и контекстима.
  • Искористите параметре: Побољшајте своје креативно искуство коришћењем мноштва напредних подешавања која Мидјоурнеи нуди. Од контролисања односа ширине и висине до прилагођавања параметра хаоса за јединствене резултате, сваки детаљ се може прилагодити вашим жељама.
  • Прихватите итеративни процес: Ваше прво уметничко дело генерисано вештачком интелигенцијом можда неће бити савршено. Прихватите овај итеративни процес и научите да прецизирате и оптимизујете своје упите за боље резултате.
  • Разумети импликације ауторских права: Док сама уметничка дела генерисана вештачком интелигенцијом нису квалификована за ауторска права, компоненте које је направио човек у њима могу бити заштићене.

У суштини, интеграција вештачке интелигенције у уметност демократизовала је креативност и замаглила границе између људских и машинских ремек-дела. Док настављамо да присуствујемо изузетном расту генеративне АИ на тржишту уметности, неоспорно је да уметничка револуција АИ, коју предводе платформе као што је Мидјоурнеи, тек почиње.

Провео сам последњих пет година урањајући се у фасцинантан свет машинског учења и дубоког учења. Моја страст и стручност довели су ме до тога да допринесем преко 50 различитих пројеката софтверског инжењеринга, са посебним фокусом на АИ/МЛ. Моја стална радозналост ме је такође привукла ка обради природног језика, пољу које желим даље да истражујем.