никулец Совладување уметност со вештачка интелигенција: Концизен водич за средно патување и брзо инженерство - Unite.AI
Поврзете се со нас

Брзо инженерство

Совладување уметност со вештачка интелигенција: Концизен водич за средно патување и брзо инженерство

mm
Ажурирани on
Midjourney генерирано ЛОГО ЗА УНИТЕ АИ

Вовед во уметност генерирана од вештачка интелигенција MidJourney

Вештачката интелигенција брзо ги пробива бариерите на неможноста и неодамна го нападна доменот на уметноста, трансформирајќи ја целосно. Сега, не треба да бидете маестрален уметник или експерт за Photoshop за да ги оживеете плодовите на вашата имагинација. Едноставно, добро артикулирано известување е сè што ви треба, благодарение на Средно патување.

Се започна со воведувањето на револуционерни технологии како DALL-E, Midjourney и StableDiffusion уште во 2022 година. значајни чекори.

Midjourney во моментов е водечки генератор на вештачка интелигенција текст-на-слика со висока резолуција на пазарот и стои висок со својот уникатен спој на генерирање текст-на-слика, уредување и зголемување на резолуцијата на медиумите и активен пристап во уметничката заедница, сè почнувајќи од 10 долари по месец. Овој сеопфатен пакет на функции претставува возбудливо платно за уметници, технолошки ентузијасти и професионалци за вештачка интелигенција, градејќи средина за креативност и иновации.

Светот на уметноста секако внимава, бидејќи генеративната вештачка интелигенција на пазарот на уметност се предвидува да биде сведок на неверојатен раст на 40.5% CAGR. Midjourney е без конкуренција во изработката на најреалистични и најквалитетни визуелни слики користејќи вештачка интелигенција.

Ефективното брзо инженерство оди подалеку од само создавање; ги опфаќа најдобрите практики. Упатствата треба да понудат јасност и да бидат концизни, но сепак да и даваат на вештачката интелигенција доволно насоки без прекумерен рецепт. Исто така, целната публика мора да се земе предвид при дизајнирањето, земајќи ги предвид варијаблите како што се возраста, полот и културното потекло, меѓу другото.

Како функционира MidJourney?

Mid-Journey користи две нови технологии за машинско учење - модели на големи јазици и дифузија. Јазичниот модел, сличен на чет-ботови со вештачка интелигенција, како што е ChatGPT, му помага на Mid-Journey да го толкува значењето на вашите барања и да ги претвори во вектори. Овој вектор потоа го води процесот на дифузија.

Внатрешните работи на Midjourney во голема мера не се откриени. Сепак, очигледно е дека користи генерирање текст-слика од две релативно нови технологии за машинско учење: големи јазични модели и модели на дифузија. Првиот е можеби познат на корисниците на платформите за вештачка интелигенција како ChatGPT, а вториот е ветувачки додаток на секторот за генерирање уметност со вештачка интелигенција. Целиот систем се потпира на CLIP база на податоци за обука, што може да се најде на страницата за истражување на OpenAI.

И покрај ограничените информации, можно е да се скицира широка слика за Midjourney's модел на дифузија, соодветно именуван како „Стабилна дифузија“. Во суштина, Стабилна дифузија е модел со отворен код кој вешто ги трансформира текстуалните барања во слики со различни стилови и содржини. Оваа софистицирана процедура се постигнува преку дифузен модел, генеративен модел кој ги премостува зависностите помеѓу текстуалните влезови и излезите на сликата.

Моделите за дифузија се изградени врз основа на методот на дифузија на обезгласување, пристап под влијание на нерамнотежна термодинамика. Овој метод систематски ја демонтира структурата на податоците и подоцна ги обновува. Овој пристап беше адаптиран за генерирање слики од Ho et al. во 2020 година, што доведе до основање на моделите за дифузија што ги гледаме денес.

Моделите на дифузија на обука вклучуваат две основни фази. Првично, процесот на напред или дифузија вклучува постепено додавање на случаен шум на влезната слика додека таа целосно не се претвори во шум. Овој процес е управуван од фиксен Марков синџир, кој постојано додава Гаусовиот шум низ неколку последователни чекори.

Работна демонстрација на средината на патувањето

Последователно, во фазата на обратна или реконструкција, моделот ги обновува оригиналните податоци од состојбата со доминација на бучава постигната во процесот на дифузија. Овој процес е воден од Марков синџир со научени Гаусови транзиции, што имплицира дека предвидувањето на густината на веројатноста во кое било дадено време е единствено зависно од состојбата постигната во претходниот временски чекор. Бидејќи латентните „x1, …, xT“ ја делат истата димензионалност како податоците, моделите за дифузија се класифицираат како модели на латентни променливи.

Цена и претплата на средината на патувањето

Додека многу чет-ботови како ChatGPT и Bing Chat нудат речиси неограничена употреба бесплатно, сценариото се разликува за генераторите на слики како Mid-Journey. Поради значителната потребна компјутерска моќ, особено од единиците за графичка обработка (GPU) и користењето на видео меморијата за процесот на отстранување бучава, услугата на Mid-Journey доаѓа со Цена.

Основниот план започнува од 10 долари месечно, обезбедувајќи околу 3.3 часа време на графичкиот процесор, доволно за приближно 200 генерации на слики. Сепак, постојат планови од повисоко ниво кои нудат неограничени слики во Релаксиран режим, иако со подолго време на чекање.

Поставување на вашето средно патување

  1. Почнувајќи со Средно патување вклучува пријавување на нивната официјална веб-страница, претплата на план и потоа пренасочување на Discord.
  2. Откако ќе го лоцирате каналот Mid-Journey на Раздор, одете до Групите на новодојденци на левата страна. Оттаму, можете да набљудувате други корисници како создаваат потсетници, да ја научите механиката на Mid-Journey и да комуницирате во раздвижена средина.
  3. Откако ќе се запознаете со околината, поканете го ботот на вашиот приватен сервер да создава слики непречено. Ботот генерира четири слики за преглед врз основа на вашето барање, овозможувајќи ви да го изберете најблиското совпаѓање со вашата оригинална идеја и дополнително да ја усовршите сликата.

Промптна структура за Midjourney

  1. Командата /imagine на каналот за несогласување во каналот Midjourney генерира единствена слика од краток текстуален опис (Prompt).
  2. За да креирате специфичен стил на различни слики, едноставно внесете ја URL-адресата на сликата заедно со текстуалното известување. Вашите нови, конзистентни излези ќе спојат елементи и од вашата избрана слика и текст.
    /замисли http://link-to-your-image –параметар1 –параметар2
    Можете да генерирате врска до вашата слика со тоа што ќе ја поставите на каналот Discord. Откако ќе се постави, кликнете со десното копче на сликата и изберете „Копирај врска“.
    Тука http://link-to-your-image и параметрите се опционални.
  3. По ова, ботот почнува да работи на вашата слика, одземајќи приближно една минута за да понуди четири алтернативи. Овој процес вклучува употреба на робусни графички процесорски единици (GPU) за обработка и интерпретација на секое барање.
  4. Следете го користењето на графичкиот процесор со користење на командата /info. Тоа ви овозможува да го проверите „Преостанатото брзо време“ и да го следите времето на графичкиот процесор на вашата претплата.

/info prompt midjourney

Зголемување и измени на сликата

За попрефинета слика, користете ги копчињата „U“ под сликите за да го надградите вашиот претпочитан избор. Можете исто така да ги користите копчињата „V“ за да направите прилагодувања на одредени слики. За понатамошни промени на подобрена слика, користете ги опциите „Направи варијации“, „Повторно зголемување на светлината“ и „Повторување на бета зголемување на резолуцијата“. Копчето „Веб“ ви овозможува да ја видите сликата во поголема големина во посебен прозорец.

Midjourney овозможува зголемување на резолуцијата на сликата до 2048×2048 (квадрат) и 2720×1530 (широк екран) преку функцијата за повторување на бета резолуцијата, со стандардна големина на мрежа од 1024×1024 (квадрат) и 1456×816 (широк екран). Секоја слика може дополнително да се подобри преку опциите за зголемување на резолуцијата „U“, кои подобруваат одредени делови од сликата.

Погледнете го ова известување кое произведува фантастични уметнички дела со верзијата V5.2 на Midjourney.

/замисли уметничкото дело прикажува осамено дрво под ѕвезденото небо, со дете кое чита под, во нијанси на спокојно сино и топло портокалово, инспирирано од потезите на францускиот импресионизам, персиските минијатури, едноставноста на Баухаус, евокативна на класичните детски илустрации од бајките, постигнување на асиметрична хармонија, изразена во волшебна, народна/наивна: –ar 15:19 –upbeta –q 2

Пример за Водич за брзо патување

Создавање на вашиот прв Midjourney AI уметност

  1. Изработка на основниот план: Замислете се себеси како уметник. Започнете со директен, живописен опис на сликата што се стремите да ја оживеете. Наведете ја главната тема, амбиентот или дури и ситните детали што сакате да ги вметнете. Користете интерпункциски знаци како запирки, загради и цртички за да ги структурирате вашите мисли. За подобри резултати, бидете експлицитни за контекстот и деталите на вашиот дизајн. Елементи како тема (на пр., змеј, стар автомобил, Абрахам Линколн), медиум (на пр., дигитална уметност, скица со молив), животна средина (на пр. вселена, под вода, раздвижен град), осветлување (на пример, меко, неонско, позадинско осветлување) , бојата (на пр. земјени тонови, живописни, пригушени), расположението (на пр. меланхолично, чудно, мирно) и составот (на пр. пејзаж, крупен, широк агол) може да бидат критични. Примери:
    • Идилична шума облеана во сончева светлина, пешачка патека која се навива во далечината
    • Град кој никогаш не спие, со неонски светла што се рефлектираат од тротоарите и разновидна толпа што се меле наоколу
  2. Внесување на стил и клучни зборови: AI на Midjourney е способна да илустрира слики во огромен број стилови како што се апстрактни, надреални или реални. Со интегрирање на стил или поврзани клучни зборови, можете да ја насочите вештачката интелигенција да создаде слика што ја отсликува вашата визија. Експериментирајте со различни стилови и клучни зборови за да ја откриете совршената мешавина. Примери:
    • Пејзажна слика што прикажува пустина во зори, пресликувајќи го стилот на Џорџија О'Киф, со пастелна палета на бои и органски форми.
    • Апстрактна слика на мирна шума, со геометриски обрасци кои формираат дрвја и зеленило, инспирирана од композициите на Пит Мондријан.
  3. Искористување на напредни поставки: сметајте го Midjourney како ваша креативна кутија со алатки, преполна со напредни поставки кои ви дозволуваат фино да ги прилагодите вашите генерирани слики. Тоа е како да ракувате со волшебно стапче, кое ви овозможува да ја донесете идеалната рамнотежа на случајност, стилизација и варијација на сликата. Ослободете ја вашата креативна моќ со дотерување со овие поставки додека не ја пронајдете совршената мешавина што ќе резонира со вашата визија. Примери:
    • Мирна јапонска градина со езерце што ги рефлектира дрвјата од црешата – семе 22 –s 150 –c 40
    • Дистописки сајберпанк град, осветлен со неонски светла – Seed 88 –s 600 –c 60
  4. Истакнување на елементи со тегови: Визуелизирајте ја вашата слика како симфонија, при што секој елемент придонесува за големиот ансамбл. Користејќи ја ознаката „::“, можете да го диктирате значењето на различни елементи во вашата слика, што ќе ви овозможи да го контролирате центарот на вниманието. Примери:
    • [Елегантен паун]::3 качен на [дрво вистерија]::1 цвета со живописни цвеќиња
    • [Величествениот слон]::2 ужива во сјајот на [заоѓањето на сонцето]::1 во саваната
  5. Midjourney е процес на обиди и грешки: Неопходно е експериментирање со различни елементи и карактеристики. Секоја повторување ќе ве приближи до сликата што сте замислиле да ја оживеете.

Параметри на средината на патувањето

Моделот на Midjourney работи со прилагодливи параметри кои го контролираат исходот од процесот на генерирање слики. Овие параметри им овозможуваат на корисниците да ја дотеруваат и прилагодат нивната генерирана уметност, дотерувајќи го моделот за да создаваат излези кои совршено одговараат на нивната цел.

Подолу се наведени основните и напредните параметри, нивните функции и како да се користат за целосно искористување на можностите на Midjourney:

  • Сооднос на аспект (–aspect или –ar): Овој параметар го контролира односот помеѓу ширината и висината на генерираната слика. На пример, соодносот од 16:9 е совршен за сликички на YouTube, додека 1:1 создава квадратна слика одлична за Instagram.
  • Хаос (–хаос): Овој параметар ја прилагодува разновидноста на почетната мрежа на слики и се движи од 0 до 100. Повисоките вредности за хаос ќе ви дадат непредвидливи и уникатни резултати, додека пониските вредности ќе обезбедат поконзистентни резултати.
  • Не (–не): Овој параметар ви помага да елиминирате одредени елементи или карактеристики од генерираната слика. На пример, ако сакате слика без црвено, можете да користите „–без црвено“.
  • Квалитет (–квалитет или –q): Оваа поставка го прилагодува времето потребно за генерирање слика. Повисокиот квалитет бара повеќе време за обработка, но дава сложени детали. Овој параметар може да добие вредности од 25, 5, 1 или 2.
  • Seed (–seed): Овој параметар го одредува почетниот визуелен шум, делувајќи како основна линија за генерираната слика. Користењето на истиот број на семе со истиот промпт ќе даде слични резултати. Прифаќа цели броеви помеѓу 0–4294967295.
  • Стоп (–стоп): Со овој параметар, можете предвреме да ја прекинете работата, создавајќи помалку детални, но потенцијално интересни резултати. Опсегот е 10-100. На пример, ако наведете „–стоп 50“, процесот на генерирање слики ќе запре со 50% завршување, што ќе резултира со помалку детална, можеби апстрактна слика.
  • Стилизирај (–стилизирај или –s): Ова го контролира нивото на уметничка примена на генерираната слика. Пониските вредности на стилизација даваат резултати поблиску до првичниот повик, додека повисоките вредности резултираат со поапстрактни и уметнички интерпретации. Во v5, стандардната вредност е 100, но можете да ја поставите насекаде од 0-1000.
  • Модел верзија: Можете да изберете од различни верзии на моделот Midjourney со користење на параметарот –version или –v.
  • Ниџи: модел специјализиран за слики во аниме стил. Може да се пристапи со помош на параметарот –niji.
  • Highmi дефиниција: за апстрактни и пејзажни слики, параметарот –hd активира рана верзија на моделот што дава поголеми, помалку конзистентни слики.
  • Тест модели: Midjourney нуди специјални модели за специфична употреба. –test и –testp ги активираат стандардните и моделите за тестирање фокусирани на фотографија, соодветно.
  • Зголемување на резолуцијата: алгоритамот Midjourney започнува со мрежа на слики со ниска резолуција. Нуди неколку модели за зголемување на резолуцијата за подобрување на големината и деталите на сликата.
    • Uplight: Алтернативно зголемување на резолуцијата на светлината (–uplight) обезбедува зголемени слики кои се помалку детални, но помазни.
    • Upbeta: параметарот –upbeta води до слики со значително помалку дополнителни детали, останувајќи поблиску до оригиналната слика на мрежата.
    • Upanime: Подобрувачот на –upanime е дизајниран специјално да работи со –niji Midjourney Model.
  • Тежина на сликата: користете –iw за да ја прилагодите тежината на пораката за слика во однос на тежината на текстот. Стандардната вредност е 0.25.
  • Sameseed: Параметарот –sameseed осигурува дека сите слики во почетната мрежа го користат истиот стартен шум, создавајќи многу слични генерирани слики.
  • Видео: Midjourney може да зачува видео за напредок од почетниот процес на генерирање мрежа на слики користејќи го параметарот –video.
  • Креативно: со параметарот –creative, моделите за тестирање и тестп даваат поразновидни и креативни слики.

Midjourney постојано објавува ажурирања за да го подобри корисничкото искуство, а најновата е верзијата 5.2, лансирана во јуни 2023 година. Со додавање –v 5.2 на вашиот промпт или избирање преку командата /settings, корисниците можат да пристапат до овој напреден модел. Верзијата 5.2 нуди супериорни детали за сликата и поинтуитивно ги разбира барањата, донесувајќи посветли бои и подобрени композиции.

Разбирање на авторските права за уметнички дела генерирани од вештачка интелигенција

Midjourney Image of Mix of AI и закони за авторски права

Во март 2023 година, Канцеларијата за авторски права на САД го разјасни својот став за авторските права на Работи генерирани од вештачка интелигенција. Политиката наведува дека иако елементите направени од човек во креациите со вештачка интелигенција (како списи или уникатни дизајни) можат да бидат заштитени, сликите произведени со вештачка интелигенција не се квалификуваат за авторски права, придржувајќи се до глобалните норми дека само човечките креации се подобни за заштита на авторски права.

Во контекст на уметноста со вештачка интелигенција, авторските права не се едноставни. Додека дигиталната уметност има придонес од човечкиот уметник, уметноста генерирана од вештачката интелигенција се создава без директна човечка интервенција, што го комплицира прашањето за авторството и сопственоста. Според Канцеларијата за авторски права на САД, првичната сопственост е доделена на авторот на делото - човечки креатор. Меѓутоа, бидејќи вештачката интелигенција не може да се смета за автор, уметноста генерирана од вештачка интелигенција нема јасна сопственост.

Најновото упатство од Канцеларијата за авторски права на САД дозволува авторско право на уметноста со вештачка интелигенција само кога содржи доволно човечко авторство. Нивото на „доволно човечко авторство“ останува недефинирано и зависи од степенот на човечка вклученост во креирањето на уметничкото дело со вештачка интелигенција.

Интересно е тоа што Midjourney, платформа базирана на вештачка интелигенција за создавање слики, воспостави свои политики за правата на користење. Корисниците на бесплатен пробен период можат да ги користат сликите за некомерцијални цели под Меѓународната лиценца Creative Commons Attribution-NonCommercial 4.0 (CC BY-NC 4.0), со соодветна заслуга за Midjourney. Сепак, претплатниците кои плаќаат може да ги користат сликите за која било цел, вклучително и комерцијална, според Општите комерцијални услови. Овој развој во просторот за авторски права претставува интригантна динамика помеѓу вештачката интелигенција и човечката креативност.

Користење на Midjourney за динамични дизајни на интерфејс и генерирање креативни логоа

Од дизајнирање интуитивни интерфејси за веб-локации или мобилни апликации до изработка на уникатни логоа и банери, Midjourney ги овластува креаторите на содржини со генерирање низа алтернативи за дизајн во рок од неколку секунди.

Еве како функционира. Секој дизајн започнува со барање, кое делува како план за следење на вештачката интелигенција. Да претпоставиме дека дизајнирате интерфејс за апликација за онлајн-туторска платформа. Типично известување може да биде: „/замислете Кориснички интерфејс на платформата за онлајн туторство, Dribbble, висока резолуција, 4K, како академијата на Кан“.

Почетните исходи можеби нема да ја погодат перфектно. На пример, додавањето на „Adobe XD“ во мешавината може да му помогне на Midjourney да ги прилагоди своите дизајни за да бидат покомпатибилни со Adobe XD. Оптимизиран промпт ќе биде:

/imagine Платформа за онлајн туторство, кориснички интерфејс, Adobe XD, Dribbble, висока резолуција, 4K, минималистички дизајн

Midjourney Слика на дизајни на UI/UX на апликации за работна површина

 

Текст инспирирано лого или банери користејќи Midjourney

Ајде да истражиме како да креираме банер со лого за UNITE AI.

Прво, треба да имате едноставна слика на текстот што сакате да го прикажете. Можете да го креирате ова користејќи која било алатка за графички дизајн или уредувач на текст и да го поставите на вашиот канал Discord.

примерок од текст за ЛОГОТО НА ОБЕДИНЕТЕ
Едноставна слика на текст што се користи за креирање на логото UNITE

Прашањето за креирање на банерот е:

/замисли Писма: ОБЕДИНЕТЕ во футуристички лого со фонтови инспирирани од вештачка интелигенција со букви UNITE –v 5 –ar 16:9

Екран со функции за промпт на Midjourney

Погледнете ги овие примери за повеќе идеи:

/замисли осамен музичар кој изведува мирна мелодија на пловечки град во самрак, арт нуво стил

Водич за брзо патување: Слика на индиската уметност

 

/immagine Слика на идна личност која работи на футуристичка работна маса, опкружена со холографски екрани и напредна технологија. Лицето носи елегантен, сребрен комбинезон и има очила за виртуелна реалност. Околината е исполнета со неонски светла и лебдечки холограми. Атмосферата е футуристичка и висока технологија, со чувство на возбуда и иновативност. Камерата е дигитална камера со висока резолуција, која прецизно го доловува секој детал. Уметничкиот стил е спој на сајберпанк и минимализам, со фокус на чисти линии и смели бои. Режисерите, кинематограферите, фотографите, модните дизајнери, карикатуристите и уметниците кои соработуваат во оваа уникатна комбинација се Кристофер Нолан, Роџер Дикинс, Ени Лејбовиц, Вирџил Аблох, Хајао Мијазаки и Кавс.

Навестување за средно патување за идно лице кое работи

/замислете 1940-ти – стил на Барби како медицинска сестра за време на војна, во стар амбиент на воена болница, грижејќи се за ранетите војници, во стилот на класичните илустрации на Mattel, со атмосфера на фотографија од Втората светска војна со сепија тон 8k –v 5 –ar 16 :9

Водич за брзо патување: Слика на Барби во уникатни поставки

/замисли Рамка од жена која се потпира на сајберпанк, ховербајк, јапонско аниме, развлечени градски пејзажи, 32k, сложена космодром, минлива, панорама на облакодер, елегантни

Midjourney Слика на девојка во сајберпанк стил

 

Завршни мисли: Навигација низ светот на уметноста со вештачка интелигенција со Midjourney

Запомнете: „Сликата вреди илјада зборови“. Детален, жив опис може да направи чуда. Да, Midjourney не е бесплатен за користење. Сепак, тој прави револуција во светот на уметноста и ги проширува нашите креативни можности преку својата најсовремена вештачка интелигенција текст-на-слика технологија. Со способноста да се конвертира едноставна текстуална порака во слика со висока резолуција, тоа е алатка која ветува безгранични можности, не само за уметниците, туку и за дизајнерите на UI/UX, технолошките ентузијасти и професионалците за вештачка интелигенција.

Еве неколку суштински рецепти што треба да ги запомните додека се впуштате во вашата авантура во средината на патувањето:

  • Научете ги основите на барањето Midjourney: користете јасни, прецизни и сеопфатни описи што ја опфаќаат вашата визија за ефективно да ја водат вештачката интелигенција. Не заборавајте да ја земете предвид вашата публика и не двоумете се да експериментирате со различни стилови, расположенија и контексти.
  • Искористете ги параметрите: Подобрете го вашето креативно искуство со користење на мноштвото напредни поставки што ги нуди Midjourney. Од контрола на соодносот до прилагодување на параметарот хаос за уникатни резултати, секој детал може да се прилагоди на вашите преференци.
  • Прифатете го итеративниот процес: вашето прво уметничко дело генерирано со вештачка интелигенција можеби не е совршено. Прифатете го овој итеративен процес и научете да ги усовршувате и оптимизирате вашите барања за подобри резултати.
  • Разберете ги импликациите на авторските права: додека самите уметнички дела генерирани од вештачка интелигенција не се подобни за авторски права, компонентите направени од човек во нив може да бидат заштитени.

Во суштина, интеграцијата на вештачката интелигенција во уметноста ја демократизираше креативноста и ги замати границите помеѓу ремек-делата направени од човекот и од машината. Додека продолжуваме да бидеме сведоци на извонредниот раст на генеративната вештачка интелигенција на пазарот на уметност, неспорно е дека уметничката револуција на ВИ, предводена од платформи како Midjourney, штотуку започнува.

Изминатите пет години ги поминав потопувајќи се во фасцинантниот свет на машинското учење и длабокото учење. Мојата страст и експертиза ме наведоа да придонесам за над 50 различни проекти за софтверско инженерство, со посебен фокус на AI/ML. Мојата постојана љубопитност, исто така, ме привлече кон Обработка на природни јазици, поле кое јас сум желен да го истражам понатаму.