Արհեստական բանականություն

EasyPhoto. Ձեր անձնական AI լուսանկարների գեներատորը

Թարմացվել է on Հոկտեմբեր 30, 2023

EasyPhoto. Ձեր անձնական AI դիմանկարների գեներատորը

Կայուն դիֆուզիոն Վեբ օգտագործողի միջերեսը կամ SD-WebUI-ն համապարփակ նախագիծ է կայուն տարածման մոդելների համար, որն օգտագործում է Gradio գրադարանը՝ զննարկիչի միջերես տրամադրելու համար: Այսօր մենք խոսելու ենք EasyPhoto-ի մասին՝ նորարարական WebUI հավելվածի, որը վերջնական օգտագործողներին հնարավորություն է տալիս ստեղծել AI դիմանկարներ և պատկերներ: EasyPhoto WebUI հավելվածը ստեղծում է արհեստական ինտելեկտի դիմանկարներ՝ օգտագործելով տարբեր ձևանմուշներ՝ աջակցելով տարբեր լուսանկարչական ոճերին և բազմաթիվ փոփոխություններին: Բացի այդ, EasyPhoto-ի հնարավորություններն ավելի մեծացնելու համար օգտվողները կարող են պատկերներ ստեղծել՝ օգտագործելով SDXL մոդելը՝ ավելի գոհացուցիչ, ճշգրիտ և բազմազան արդյունքների համար: Եկեք սկսենք.

EasyPhoto-ի և Stable Diffusion-ի ներածություն

Stable Diffusion Framework-ը տարածված և ամուր դիֆուզիոն վրա հիմնված գեներացման շրջանակ է, որն օգտագործվում է ծրագրավորողների կողմից՝ մուտքագրված տեքստի նկարագրությունների հիման վրա իրատեսական պատկերներ ստեղծելու համար: Շնորհիվ իր հնարավորությունների՝ Stable Diffusion Framework-ը պարծենում է կիրառությունների լայն շրջանակով, ներառյալ՝ պատկերի արտապատկերում, պատկերի ներկում և պատկերից պատկեր թարգմանություն: Stable Diffusion Web UI-ն կամ SD-WebUI-ն առանձնանում է որպես այս շրջանակի ամենահայտնի և հայտնի հավելվածներից մեկը: Այն առանձնանում է բրաուզերի ինտերֆեյսով, որը կառուցված է Gradio գրադարանի վրա, որն ապահովում է ինտերակտիվ և հարմար ինտերֆեյս Stable Diffusion մոդելների համար: Պատկերի ստեղծման գործում վերահսկողությունն ու օգտագործելիությունը հետագա ուժեղացնելու համար SD-WebUI-ն ինտեգրում է Stable Diffusion բազմաթիվ հավելվածներ:

Շնորհիվ SD-WebUI շրջանակի առաջարկած հարմարության՝ EasyPhoto շրջանակի մշակողները որոշեցին այն ստեղծել որպես վեբ հավելված, այլ ոչ թե որպես ամբողջական հավելված: Ի տարբերություն գոյություն ունեցող մեթոդների, որոնք հաճախ տառապում են ինքնության կորստից կամ պատկերների մեջ ներմուծում են անիրատեսական հատկանիշներ, EasyPhoto շրջանակն օգտագործում է Stable Diffusion մոդելների պատկերից պատկերի հնարավորությունները՝ ճշգրիտ և իրատեսական պատկերներ ստեղծելու համար: Օգտատերերը հեշտությամբ կարող են տեղադրել EasyPhoto շրջանակը որպես ընդլայնում WebUI-ի ներսում՝ բարձրացնելով օգտատերերի հարմարավետությունն ու հասանելիությունը օգտվողների ավելի լայն շրջանակի համար: EasyPhoto-ի շրջանակը թույլ է տալիս օգտատերերին ստեղծել ինքնությամբ առաջնորդվող, բարձրորակ և իրատեսական AI դիմանկարներ որոնք սերտորեն նման են մուտքագրման ինքնությանը:

Նախ, EasyPhoto շրջանակը օգտատերերին խնդրում է ստեղծել իրենց թվային դոփելգանգերը՝ վերբեռնելով մի քանի պատկերներ՝ առցանց վարժեցնելու համար դեմքի LoRA կամ ցածր աստիճանի հարմարվողականության մոդելը: LoRA շրջանակը արագորեն ճշգրտում է դիֆուզիոն մոդելները՝ օգտագործելով ցածր աստիճանի հարմարվողական տեխնոլոգիա: Այս գործընթացը թույլ է տալիս հիմնված մոդելին հասկանալ կոնկրետ օգտագործողների ID տեղեկատվությունը: Այնուհետև վերապատրաստված մոդելները միաձուլվում և ինտեգրվում են ելակետային կայուն դիֆուզիոն մոդելին՝ միջամտության համար: Ավելին, միջամտության գործընթացի ընթացքում մոդելը օգտագործում է կայուն դիֆուզիոն մոդելներ՝ փորձելով վերաներկել դեմքի հատվածները միջամտության ձևանմուշում, և մուտքային և ելքային պատկերների նմանությունը ստուգվում է ControlNet-ի տարբեր միավորների միջոցով:

EasyPhoto շրջանակը նաև կիրառում է երկփուլ դիֆուզիոն գործընթաց՝ լուծելու պոտենցիալ խնդիրները, ինչպիսիք են սահմանային արտեֆակտները և ինքնության կորուստը, այդպիսով ապահովելով, որ ստեղծված պատկերները նվազագույնի են հասցնում տեսողական անհամապատասխանությունները՝ պահպանելով օգտատիրոջ ինքնությունը: Ավելին, EasyPhoto շրջանակում միջամտության խողովակաշարը ոչ միայն սահմանափակվում է դիմանկարների ստեղծմամբ, այլև այն կարող է օգտագործվել նաև օգտագործողի ID-ի հետ կապված ցանկացած բան ստեղծելու համար: Սա ենթադրում է, որ երբ դուք մարզում եք LoRA մոդելը որոշակի ID-ի համար դուք կարող եք ստեղծել արհեստական ինտելեկտի նկարների լայն տեսականի, և այդպիսով այն կարող է ունենալ լայնածավալ ծրագրեր, ներառյալ վիրտուալ փորձարկումները:

Դուք ամփոփում եք EasyPhoto-ի շրջանակը

Առաջարկում է նոր մոտեցում՝ վարժեցնելու LoRA մոդելը՝ ներառելով բազմաթիվ LoRA մոդելներ՝ ստեղծված պատկերների դեմքի հավատարմությունը պահպանելու համար:
Օգտագործում է ամրապնդման ուսուցման տարբեր մեթոդներ՝ LoRA մոդելները դեմքի ինքնության պարգևների օպտիմալացման համար, ինչը հետագայում օգնում է բարձրացնել նույնականությունը ուսուցման պատկերների և ստացված արդյունքների միջև:
Առաջարկում է երկաստիճան ներկերի վրա հիմնված դիֆուզիոն գործընթաց, որի նպատակն է ստեղծել AI-ի լուսանկարներ բարձր էսթետիկությամբ և նմանությամբ:

EasyPhoto. Ճարտարապետություն և ուսուցում

Հետևյալ նկարը ցույց է տալիս EasyPhoto AI շրջանակի ուսուցման գործընթացը:

Ինչպես երևում է, շրջանակը նախ խնդրում է օգտատերերին մուտքագրել ուսուցման պատկերները, այնուհետև կատարում է դեմքի հայտնաբերում՝ դեմքի գտնվելու վայրը հայտնաբերելու համար: Երբ շրջանակը հայտնաբերում է դեմքը, այն կտրում է մուտքագրված պատկերը՝ օգտագործելով նախապես սահմանված հատուկ հարաբերակցությունը, որը կենտրոնանում է բացառապես դեմքի հատվածի վրա: Շրջանակն այնուհետև տեղադրում է մաշկի գեղեցկացման և ընդգծվածության հայտնաբերման մոդել՝ դեմքի ուսուցման մաքուր և հստակ պատկեր ստանալու համար: Այս երկու մոդելները վճռորոշ դեր են խաղում դեմքի տեսողական որակի բարձրացման գործում, ինչպես նաև ապահովում են, որ ֆոնային տեղեկատվությունը հեռացված է, և մարզման պատկերը հիմնականում պարունակում է դեմքը: Վերջապես, շրջանակն օգտագործում է այս մշակված պատկերները և մուտքագրման հուշումները՝ վարժեցնելու LoRA մոդելը, և այդպիսով զինելով այն օգտագործողի դեմքի առանձնահատկությունները ավելի արդյունավետ և ճշգրիտ ընկալելու ունակությամբ:

Ավելին, վերապատրաստման փուլում շրջանակը ներառում է վավերացման կարևոր քայլ, որտեղ շրջանակը հաշվարկում է դեմքի ID բացը օգտագործողի մուտքագրված պատկերի և ստուգման պատկերի միջև, որը ստեղծվել է վարժեցված LoRA մոդելի կողմից: Վավերացման քայլը հիմնարար գործընթաց է, որն առանցքային դեր է խաղում LoRA մոդելների միաձուլման հասնելու գործում՝ ի վերջո ապահովելով, որ վերապատրաստված LoRA շրջանակ վերածվում է դոպելգանգերի կամ օգտագործողի ճշգրիտ թվային ներկայացման: Բացի այդ, ստուգման պատկերը, որն ունի face_id-ի օպտիմալ գնահատականը, կընտրվի որպես face_id պատկեր, և այս face_id պատկերն այնուհետև կօգտագործվի միջամտության առաջացման նույնականությունը բարձրացնելու համար:

Շարժվելով, հիմնվելով համույթի գործընթացի վրա, շրջանակը վերապատրաստում է LoRA մոդելներին, որոնց հավանականության գնահատումը հիմնական նպատակն է, մինչդեռ դեմքի նույնականության պահպանումը հիմնական նպատակն է: Այս խնդիրը լուծելու համար EasyPhoto-ի շրջանակն օգտագործում է ամրապնդման ուսուցման մեթոդներ՝ ուղղակիորեն ներքևի նպատակը օպտիմալացնելու համար: Արդյունքում, դեմքի առանձնահատկությունները, որոնք սովորում են LoRA մոդելները, ցուցադրում են բարելավում, ինչը հանգեցնում է ձևանմուշների ստեղծած արդյունքների ավելի մեծ նմանության, ինչպես նաև ցույց է տալիս կաղապարների ընդհանրացումը:

Միջամտության գործընթաց

Հետևյալ նկարը ցույց է տալիս EasyPhoto շրջանակում անհատական օգտագործողի ID-ի միջամտության գործընթացը և բաժանված է երեք մասի:

Դեմքի նախնական գործընթաց ControlNet հղումը և նախապես մշակված մուտքային պատկերը ստանալու համար:

Առաջին դիֆուզիոն որն օգնում է ստեղծել կոպիտ արդյունքներ, որոնք նման են օգտագործողի մուտքագրմանը:

Երկրորդ դիֆուզիոն որը ամրագրում է սահմանային արտեֆակտները՝ այդպիսով պատկերները դարձնելով ավելի ճշգրիտ և ավելի իրատեսական:

Մուտքի համար շրջանակը վերցնում է face_id պատկեր (ստեղծվել է վերապատրաստման վավերացման ընթացքում՝ օգտագործելով face_id օպտիմալ միավորը) և միջամտության ձևանմուշ: Արդյունքը օգտատիրոջ խիստ մանրամասն, ճշգրիտ և իրատեսական դիմանկարն է և շատ նման է օգտատիրոջ ինքնությանը և եզակի տեսքին` եզրակացության ձևանմուշի հիման վրա: Եկեք մանրամասն նայենք այս գործընթացներին:

Դեմքի նախնական գործընթաց

Միջամտության ձևանմուշի հիման վրա արհեստական ինտելեկտի դիմանկար ստեղծելու միջոց՝ առանց գիտակցված պատճառաբանության, SD մոդելի օգտագործումն է՝ դեմքի հատվածը միջամտության ձևանմուշում ներկելու համար: Բացի այդ, գործընթացին ControlNet Framework ավելացնելը ոչ միայն ուժեղացնում է օգտատիրոջ ինքնության պահպանումը, այլև մեծացնում է ստեղծվող պատկերների միջև նմանությունը: Այնուամենայնիվ, ControlNet-ի օգտագործումն ուղղակիորեն տարածաշրջանային ներկման համար կարող է առաջացնել հնարավոր խնդիրներ, որոնք կարող են ներառել

Մուտքի և ստեղծվող պատկերի միջև անհամապատասխանություն. Ակնհայտ է, որ ձևանմուշի պատկերի հիմնական կետերը համատեղելի չեն face_id պատկերի առանցքային կետերի հետ, այդ իսկ պատճառով ControlNet-ի օգտագործումը face_id պատկերի հետ որպես հղում կարող է հանգեցնել որոշ անհամապատասխանությունների ելքի մեջ:

Inpaint տարածաշրջանի թերությունները. Տարածաշրջանը քողարկելը և այն նոր դեմքով ներկելը կարող է հանգեցնել նկատելի թերությունների, հատկապես ներկերի սահմանի երկայնքով, ինչը ոչ միայն կազդի ստեղծված պատկերի իսկության վրա, այլև բացասաբար կանդրադառնա պատկերի ռեալիզմի վրա:
Ինքնության կորուստ Control Net-ի կողմից. Քանի որ վերապատրաստման գործընթացը չի օգտագործում ControlNet շրջանակը, ControlNet-ի օգտագործումը միջամտության փուլում կարող է ազդել վարժեցված LoRA մոդելների ունակության վրա՝ պահպանելու մուտքային օգտագործողի նույնականացումը:

Վերը նշված խնդիրները լուծելու համար EasyPhoto շրջանակն առաջարկում է երեք ընթացակարգ:

Հավասարեցրեք և տեղադրեք. Օգտագործելով դեմքի տեղադրման ալգորիթմ՝ EasyPhoto-ի շրջանակը նպատակ ունի լուծել դեմքի նշանների անհամապատասխանության խնդիրը դեմքի id-ի և ձևանմուշի միջև: Նախ, մոդելը հաշվարկում է face_id-ի և կաղապարի պատկերի դեմքի ուղենիշները, որից հետո մոդելը որոշում է աֆինական փոխակերպման մատրիցը, որը կօգտագործվի կաղապարի պատկերի դեմքի նշանները face_id պատկերի հետ հավասարեցնելու համար: Ստացված պատկերը պահպանում է face_id պատկերի նույն ուղենիշները, ինչպես նաև համընկնում է կաղապարի պատկերի հետ:

Դեմքի ապահովիչ. Face Fuse-ը նոր մոտեցում է, որն օգտագործվում է շտկելու սահմանային արտեֆակտները, որոնք դիմակների ներկման արդյունք են, և այն ներառում է արտեֆակտների ուղղում ControlNet շրջանակի միջոցով: Մեթոդը թույլ է տալիս EasyPhoto շրջանակին ապահովել ներդաշնակ եզրերի պահպանումը և դրանով իսկ ի վերջո առաջնորդել պատկերների ստեղծման գործընթացը: Դեմքի միաձուլման ալգորիթմը հետագայում միաձուլում է ռոպ (հողային ճշմարտության օգտագործողի պատկերներ) պատկերը և ձևանմուշը, ինչը թույլ է տալիս ստացված միաձուլված պատկերին ցուցադրել եզրերի սահմանների ավելի լավ կայունացում, որն այնուհետև հանգեցնում է ուժեղացված արդյունքի առաջին դիֆուզիոն փուլում:
ControlNet ուղղորդված վավերացում. Քանի որ LoRA մոդելները չեն վերապատրաստվել ControlNet Framework-ի միջոցով, դրա օգտագործումը եզրակացության գործընթացի ընթացքում կարող է ազդել LoRA մոդելի՝ ինքնությունները պահպանելու կարողության վրա: EasyPhoto-ի ընդհանրացման հնարավորությունները բարձրացնելու համար շրջանակը հաշվի է առնում ControlNet Framework-ի ազդեցությունը և ներառում է LoRA մոդելներ տարբեր փուլերից:

Առաջին դիֆուզիոն

Դիֆուզիոն առաջին փուլն օգտագործում է կաղապարի պատկերը՝ եզակի id-ով պատկեր ստեղծելու համար, որը նման է մուտքագրված օգտագործողի ID-ին: Մուտքային պատկերը օգտատիրոջ մուտքագրված պատկերի և ձևանմուշի պատկերի միաձուլումն է, մինչդեռ տրամաչափված դեմքի դիմակը մուտքային դիմակն է: Պատկերի ստեղծման նկատմամբ վերահսկողությունն ավելի մեծացնելու համար EasyPhoto շրջանակը միավորում է երեք ControlNet միավոր, որտեղ առաջին ControlNet միավորը կենտրոնանում է միաձուլված պատկերների կառավարման վրա, երկրորդ ControlNet միավորը վերահսկում է միաձուլված պատկերի գույները, իսկ վերջնական ControlNet միավորը բաց է: փոխարինված պատկերի (իրական ժամանակում բազմամարդ մարդու դիրքի վերահսկում), որը պարունակում է ոչ միայն կաղապարի պատկերի դեմքի կառուցվածքը, այլև օգտագործողի դեմքի ինքնությունը:

Երկրորդ դիֆուզիոն

Դիֆուզիոն երկրորդ փուլում դեմքի սահմանին մոտ գտնվող արտեֆակտները զտվում և ճշգրտվում են՝ օգտատերերին տրամադրելով ճկունություն՝ դիմակավորելու պատկերի որոշակի հատվածը՝ փորձելով բարձրացնել ստեղծման արդյունավետությունը այդ հատուկ տարածքում: Այս փուլում շրջանակը միաձուլում է առաջին դիֆուզիոն փուլից ստացված ելքային պատկերը ռոպ պատկերի կամ օգտագործողի պատկերի արդյունքի հետ՝ այդպիսով ստեղծելով երկրորդ դիֆուզիոն փուլի մուտքային պատկերը։ Ընդհանուր առմամբ, երկրորդ դիֆուզիոն փուլը վճռորոշ դեր է խաղում ընդհանուր որակի և ստեղծված պատկերի մանրամասների բարձրացման գործում:

Բազմ օգտվողի ID-ներ

EasyPhoto-ի կարևորագույն կետերից մեկը բազմաթիվ օգտվողների ID-ներ ստեղծելու աջակցությունն է, և ստորև բերված նկարը ցույց է տալիս EasyPhoto շրջանակում բազմաթիվ օգտվողների ID-ների միջամտության գործընթացի խողովակաշարը:

Բազմ օգտատերերի ID-ի ստեղծման համար աջակցություն տրամադրելու համար EasyPhoto շրջանակը նախ կատարում է դեմքի հայտնաբերում միջամտության ձևանմուշի վրա: Այս միջամտության ձևանմուշները այնուհետև բաժանվում են բազմաթիվ դիմակների, որտեղ յուրաքանչյուր դիմակ պարունակում է միայն մեկ դեմք, իսկ մնացած պատկերը ծածկված է սպիտակով, այդպիսով բաժանելով բազմաբնակարան օգտատերերի ID-ի առաջացումը՝ անհատական օգտատերերի ID-ներ ստեղծելու պարզ առաջադրանքի: Երբ շրջանակը ստեղծում է օգտագործողի նույնականացման պատկերները, այդ պատկերները միաձուլվում են եզրակացության ձևանմուշի մեջ՝ այդպիսով հեշտացնելով ձևանմուշի պատկերների անխափան ինտեգրումը ստեղծված պատկերների հետ, ինչը, ի վերջո, հանգեցնում է բարձրորակ պատկերի:

Փորձեր և արդյունքներ

Այժմ, երբ մենք հասկացանք EasyPhoto շրջանակը, ժամանակն է, որ մենք ուսումնասիրենք EasyPhoto շրջանակի աշխատանքը:

Վերոնշյալ պատկերը ստեղծվել է EasyPhoto հավելվածի կողմից, և այն օգտագործում է Style-ի վրա հիմնված SD մոդել՝ պատկերների ստեղծման համար: Ինչպես նկատվում է, ստեղծված պատկերները իրատեսական տեսք ունեն և բավականին ճշգրիտ են։

Վերևում ավելացված պատկերը ստեղծվել է EasyPhoto շրջանակի կողմից՝ օգտագործելով Comic Style-ի վրա հիմնված SD մոդելը: Ինչպես երևում է, զավեշտական լուսանկարները և իրատեսական լուսանկարները բավականին իրատեսական տեսք ունեն և շատ նման են մուտքագրված պատկերին՝ օգտատիրոջ հուշումների կամ պահանջների հիման վրա:

Ստորև ավելացված պատկերը ստեղծվել է EasyPhoto շրջանակի կողմից՝ օգտագործելով Multi-Person կաղապարը: Ինչպես պարզ երևում է, ստացված պատկերները պարզ են, ճշգրիտ և նման են բնօրինակ պատկերին:

EasyPhoto-ի օգնությամբ օգտվողներն այժմ կարող են ստեղծել արհեստական ինտելեկտի դիմանկարների լայն տեսականի կամ ստեղծել մի քանի օգտվողի ID-ներ՝ օգտագործելով պահպանված ձևանմուշներ, կամ օգտագործել SD մոդելը՝ եզրակացությունների ձևանմուշներ ստեղծելու համար: Վերևում ավելացված պատկերները ցույց են տալիս EasyPhoto շրջանակի կարողությունը տարբեր և բարձրորակ AI նկարներ ստեղծելու համար:

Եզրափակում

Այս հոդվածում մենք խոսել ենք EasyPhoto-ի մասին, ա նոր WebUI հավելված որը թույլ է տալիս վերջնական օգտագործողներին ստեղծել AI դիմանկարներ և պատկերներ: EasyPhoto WebUI հավելվածը ստեղծում է AI դիմանկարներ՝ օգտագործելով կամայական ձևանմուշներ, և EasyPhoto WebUI-ի ներկայիս հետևանքները աջակցում են տարբեր լուսանկարների ոճերի և բազմաթիվ փոփոխություններին: Բացի այդ, EasyPhoto-ի հնարավորություններն էլ ավելի բարձրացնելու համար օգտվողներն ունեն ճկունություն՝ ստեղծելու պատկերներ՝ օգտագործելով SDXL մոդելը՝ ավելի գոհացուցիչ, ճշգրիտ և բազմազան պատկերներ ստեղծելու համար: EasyPhoto շրջանակն օգտագործում է կայուն դիֆուզիոն բազային մոդել՝ զուգակցված նախապես պատրաստված LoRA մոդելի հետ, որն ապահովում է բարձրորակ պատկերի արդյունքներ:

Հետաքրքրվա՞ծ եք պատկերների գեներատորներով: Մենք տրամադրում ենք նաև ցանկը Լավագույն AI Headshot գեներատորներ եւ Լավագույն AI պատկերի գեներատորներ որոնք հեշտ է օգտագործել և չեն պահանջում տեխնիկական փորձաքննություն:

Հարակից թեմաներ.հեշտ լուսանկար

Հաջորդը

ChatDev. հաղորդակցական գործակալներ ծրագրային ապահովման մշակման համար

Բաց մի թողեք

Google-ի ռազմավարական ընդլայնում արհեստական ինտելեկտի ոլորտում. 2 միլիարդ դոլարի խաղադրույք Anthropic-ում

Կունալ Քեջրիվալ

«Մասնագիտությամբ ինժեներ, անգիր գրող». Կունալը տեխնիկական գրող է, որն ունի AI և ML-ի խորը սեր և հասկացողություն, որը նվիրված է այս ոլորտներում բարդ հասկացությունների պարզեցմանը իր գրավիչ և տեղեկատվական փաստաթղթերի միջոցով:

Unite.AI

EasyPhoto. Ձեր անձնական AI լուսանկարների գեներատորը

Արհեստական բանականություն

EasyPhoto. Ձեր անձնական AI լուսանկարների գեներատորը

Բովանդակություն

EasyPhoto-ի և Stable Diffusion-ի ներածություն

EasyPhoto. Ճարտարապետություն և ուսուցում