ဉာဏ်ရည်တု

EasyPhoto- သင်၏ကိုယ်ပိုင် AI ဓာတ်ပုံထုတ်လုပ်သူ

နောက်ဆုံးရေးသားချိန် on အောက်တိုဘာလ 30, 2023

EasyPhoto - သင်၏ကိုယ်ပိုင် AI ပုံတူမီးစက်

တည်ငြိမ်သောပျံ့နှံ့မှု Web User Interface (သို့) SD-WebUI သည် Gradio စာကြည့်တိုက်ကို အသုံးပြု၍ ဘရောက်ဆာအင်တာဖေ့စ်ကို ပံ့ပိုးပေးသည့် Stable Diffusion မော်ဒယ်များအတွက် ပြီးပြည့်စုံသော ပရောဂျက်တစ်ခုဖြစ်သည်။ ယနေ့တွင်၊ သုံးစွဲသူများအား AI ပုံတူများနှင့် ပုံများဖန်တီးနိုင်စေမည့် ဆန်းသစ်သော WebUI ပလပ်အင်တစ်ခုဖြစ်သည့် EasyPhoto အကြောင်း ဆွေးနွေးသွားပါမည်။ EasyPhoto WebUI ပလပ်အင်သည် မတူညီသော ဓာတ်ပုံစတိုင်များနှင့် ပြုပြင်မွမ်းမံမှုများစွာကို ပံ့ပိုးပေးသည့် ပုံစံအမျိုးမျိုးကို အသုံးပြု၍ AI ပုံတူများကို ဖန်တီးပေးသည်။ ထို့အပြင်၊ EasyPhoto ၏စွမ်းရည်များကို ပိုမိုမြှင့်တင်ရန်၊ အသုံးပြုသူများသည် ပိုမိုကျေနပ်စရာကောင်းသော၊ တိကျပြီး ကွဲပြားသောရလဒ်များအတွက် SDXL မော်ဒယ်ကို အသုံးပြု၍ ပုံများကို ဖန်တီးနိုင်သည်။ စလိုက်ရအောင်။

EasyPhoto နှင့် Stable Diffusion မိတ်ဆက်

Stable Diffusion framework သည် ထည့်သွင်းထားသော စာသားဖော်ပြချက်များအပေါ် အခြေခံ၍ လက်တွေ့ကျသော ရုပ်ပုံများကို ထုတ်လုပ်ရန်အတွက် developer များအသုံးပြုသည့် ရေပန်းစားပြီး အားကောင်းသည့် ပျံ့နှံ့မှုအခြေခံ မျိုးဆက်ဘောင်တစ်ခုဖြစ်သည်။ ၎င်း၏စွမ်းဆောင်နိုင်မှုများကြောင့် Stable Diffusion framework သည် ရုပ်ပုံပန်းချီဆွဲခြင်း၊ ရုပ်ပုံဆေးခြယ်ခြင်းနှင့် ပုံမှပုံတစ်ပုံသို့ ဘာသာပြန်ခြင်းအပါအဝင် ကျယ်ပြန့်သောအသုံးချပရိုဂရမ်များပါရှိသည်။ Stable Diffusion Web UI သို့မဟုတ် SD-WebUI သည် ဤ framework ၏ ရေပန်းအစားဆုံးနှင့် လူသိများသော အပလီကေးရှင်းများထဲမှ တစ်ခုအဖြစ် ထင်ရှားသည်။ ၎င်းတွင် Gradio စာကြည့်တိုက်တွင် တည်ဆောက်ထားသော ဘရောက်ဆာအင်တာဖေ့စ်တစ်ခု ပါဝင်ပြီး Stable Diffusion မော်ဒယ်များအတွက် အပြန်အလှန်တုံ့ပြန်ပြီး အသုံးပြုရလွယ်ကူသော မျက်နှာပြင်ကို ပေးဆောင်သည်။ ရုပ်ပုံထုတ်လုပ်ခြင်းတွင် ထိန်းချုပ်မှုနှင့် အသုံးပြုနိုင်စွမ်းကို ပိုမိုမြှင့်တင်ရန် SD-WebUI သည် Stable Diffusion အပလီကေးရှင်းများစွာကို ပေါင်းစပ်ထားသည်။

SD-WebUI framework မှ ပေးဆောင်သော အဆင်ပြေမှုကြောင့် EasyPhoto framework ၏ developer များသည် ပြီးပြည့်စုံသော application မဟုတ်ဘဲ web plugin တစ်ခုအဖြစ် ဖန်တီးရန် ဆုံးဖြတ်ခဲ့ကြသည်။ အထောက်အထားပျောက်ဆုံးခြင်း သို့မဟုတ် ရုပ်ပုံများတွင် လက်တွေ့မကျသောအင်္ဂါရပ်များကို မိတ်ဆက်လေ့ရှိသော ရှိပြီးသားနည်းလမ်းများနှင့် ဆန့်ကျင်ဘက်ဖြစ်သော EasyPhoto framework သည် တိကျပြီး လက်တွေ့ကျသောပုံများထုတ်လုပ်ရန်အတွက် Stable Diffusion မော်ဒယ်များ၏ ပုံတစ်ပုံမှတစ်ပုံအထိ စွမ်းဆောင်ရည်ကို မြှင့်တင်ပေးပါသည်။ အသုံးပြုသူများသည် WebUI အတွင်းရှိ တိုးချဲ့မှုတစ်ခုအနေဖြင့် EasyPhoto framework ကို လွယ်ကူစွာ ထည့်သွင်းနိုင်ပြီး သုံးစွဲသူများအတွက် ပိုမိုအဆင်ပြေစေရန်နှင့် အသုံးပြုရလွယ်ကူမှုကို တိုးမြှင့်နိုင်သည်။ EasyPhoto framework သည် သုံးစွဲသူများအား မည်သူမည်ဝါဖြစ်ကြောင်း လမ်းညွှန်ထားသော၊ အရည်အသွေးမြင့် နှင့် ဖန်တီးနိုင်စေပါသည်။ လက်တွေ့ဆန်သော AI ပုံတူများ ၎င်းသည် ထည့်သွင်းဖော်ပြချက်နှင့် နီးကပ်စွာ ဆင်တူသည်။

ပထမဦးစွာ၊ EasyPhoto framework သည် LoRA သို့မဟုတ် Low-Rank Adaptation မော်ဒယ်ကို အွန်လိုင်းတွင် လေ့ကျင့်ရန် ပုံအနည်းငယ်ကို တင်ခြင်းဖြင့် ၎င်းတို့၏ ဒစ်ဂျစ်တယ် doppelganger ဖန်တီးရန် သုံးစွဲသူများအား တောင်းဆိုထားသည်။ LoRA မူဘောင်သည် အဆင့်နိမ့်သော လိုက်လျောညီထွေမှုရှိသော နည်းပညာကို အသုံးပြုခြင်းဖြင့် ပျံ့နှံ့မှုပုံစံများကို လျင်မြန်စွာ ညှိပေးသည်။ ဤလုပ်ငန်းစဉ်သည် သီးသန့်အသုံးပြုသူများ၏ ID အချက်အလက်ကို အခြေခံမော်ဒယ်အား နားလည်ခွင့်ပြုသည်။ ထို့နောက် လေ့ကျင့်သင်ကြားထားသော မော်ဒယ်များကို အနှောင့်အယှက်ဖြစ်စေရန်အတွက် အခြေခံလိုင်း Stable Diffusion မော်ဒယ်သို့ ပေါင်းစည်းပြီး ပေါင်းစပ်ထားသည်။ ထို့အပြင်၊ အနှောင့်အယှက်ပေးသည့်လုပ်ငန်းစဉ်အတွင်း၊ မော်ဒယ်သည် အနှောင့်အယှက်ပေးသည့်ပုံစံရှိ မျက်နှာဧရိယာများကို ပြန်လည်ပြုပြင်ရန် ကြိုးပမ်းရာတွင် တည်ငြိမ်သောပျံ့နှံ့မှုပုံစံများကို အသုံးပြုကာ အဝင်နှင့်အထွက်ပုံများကြား တူညီမှုကို ControlNet ယူနစ်အမျိုးမျိုးကို အသုံးပြု၍ စစ်ဆေးမည်ဖြစ်သည်။

EasyPhoto မူဘောင်သည် နယ်နိမိတ်ရှိ ရှေးဟောင်းပစ္စည်းများနှင့် အထောက်အထားပျောက်ဆုံးခြင်းကဲ့သို့သော အလားအလာရှိသော ပြဿနာများကို ဖြေရှင်းရန် အဆင့်နှစ်ဆင့် ပျံ့နှံ့မှုလုပ်ငန်းစဉ်ကို အသုံးချထားပြီး၊ ထို့ကြောင့် အသုံးပြုသူ၏အထောက်အထားကို ထိန်းသိမ်းထားစဉ်တွင် အမြင်အာရုံကွဲလွဲမှုများကို လျှော့ချပေးကြောင်း သေချာစေပါသည်။ ထို့အပြင်၊ EasyPhoto framework ရှိ နှောင့်ယှက်မှု ပိုက်လိုင်းသည် ပုံတူများကို ဖန်တီးရန်အတွက်သာ ကန့်သတ်ထားသော်လည်း သုံးစွဲသူ၏ ID နှင့် သက်ဆိုင်သည့် မည်သည့်အရာကိုမဆို ထုတ်လုပ်ရန်အတွက်လည်း အသုံးပြုနိုင်သည်။ ဤသို့ဆိုလျှင် သင်တစ်ကြိမ်လေ့ကျင့်သည်။ LoRA မော်ဒယ် ID တစ်ခုအတွက်၊ သင်သည် ကျယ်ပြန့်သော AI ရုပ်ပုံများကို ဖန်တီးနိုင်ပြီး၊ ထို့ကြောင့် ၎င်းတွင် virtual try-ons အပါအဝင် ကျယ်ပြန့်သော အပလီကေးရှင်းများ ရှိနိုင်ပါသည်။

အကျဉ်းချုပ်အားဖြင့်၊ EasyPhoto မူဘောင်

ထုတ်လုပ်လိုက်သော ပုံများ၏ မျက်နှာ သစ္စာရှိမှုကို ထိန်းသိမ်းရန် LoRA မော်ဒယ်လ်များစွာကို ပေါင်းစပ်ခြင်းဖြင့် LoRA မော်ဒယ်ကို လေ့ကျင့်ရန် ဆန်းသစ်သော ချဉ်းကပ်နည်းကို အဆိုပြုပါသည်။
လေ့ကျင့်ရေးပုံရိပ်များနှင့် ရလဒ်များကြားရှိ အထောက်အထားများ၏ တူညီမှုကို မြှင့်တင်ရာတွင် အထောက်အကူဖြစ်စေသော မျက်နှာအမှတ်အသားဆိုင်ရာ ဆုလက်ဆောင်များအတွက် LoRA မော်ဒယ်များကို အကောင်းဆုံးဖြစ်အောင် အမျိုးမျိုးသော အားဖြည့်သင်ယူမှုနည်းလမ်းများကို အသုံးပြုသည်။
မြင့်မားသော လှပမှုနှင့် ဆင်တူသည့် AI ဓာတ်ပုံများကို ထုတ်လုပ်ရန် ရည်ရွယ်သည့် အဆင့်နှစ်ဆင့် ပန်းချီ-အခြေခံ ပျံ့နှံ့မှုဖြစ်စဉ်ကို အဆိုပြုသည်။

EasyPhoto- ဗိသုကာနှင့် လေ့ကျင့်ရေး

အောက်ပါပုံသည် EasyPhoto AI မူဘောင်၏ လေ့ကျင့်ရေးလုပ်ငန်းစဉ်ကို သရုပ်ပြသည်။

၎င်းကိုတွေ့မြင်နိုင်သည်အတိုင်း၊ framework သည် သုံးစွဲသူများအား လေ့ကျင့်ရေးပုံများကို ထည့်သွင်းရန် ဦးစွာတောင်းဆိုပြီး မျက်နှာတည်နေရာများကို သိရှိနိုင်စေရန် မျက်နှာကို ထောက်လှမ်းမှုကို လုပ်ဆောင်သည်။ framework သည် မျက်နှာကို ထောက်လှမ်းသိရှိပြီးသည်နှင့်၊ ၎င်းသည် မျက်နှာဧရိယာကို အာရုံစိုက်သည့် ကြိုတင်သတ်မှတ်ထားသော သတ်မှတ်ထားသော အချိုးအစားကို အသုံးပြု၍ ထည့်သွင်းထားသောပုံကို ဖြတ်တောက်သည်။ ထို့နောက် မူဘောင်သည် သန့်ရှင်းပြီး ကြည်လင်သော မျက်နှာလေ့ကျင့်ရေးပုံရိပ်ကို ရရှိရန်အတွက် အသားအရေ လှပမှုနှင့် ဆားရည်ကို ထောက်လှမ်းသည့် မော်ဒယ်ကို အသုံးချသည်။ ဤမော်ဒယ်နှစ်ခုသည် မျက်နှာ၏ အမြင်အာရုံ အရည်အသွေးကို မြှင့်တင်ရာတွင် အရေးပါသော အခန်းကဏ္ဍမှ ပါဝင်နေပြီး နောက်ခံအချက်အလက်များကို ဖယ်ရှားပြီးဖြစ်ကြောင်း သေချာစေရန်နှင့် လေ့ကျင့်ရေးပုံရိပ်တွင် မျက်နှာကို အများစုပါဝင်ပါသည်။ နောက်ဆုံးတွင်၊ မူဘောင်သည် LoRA မော်ဒယ်ကို လေ့ကျင့်ရန် ဤစီမံဆောင်ရွက်ထားသော ပုံများနှင့် ထည့်သွင်းမှု အချက်ပြမှုများကို အသုံးပြုကာ အသုံးပြုသူ၏ သီးခြားမျက်နှာသွင်ပြင်လက္ခဏာများကို ပိုမိုထိရောက်တိကျစွာ နားလည်နိုင်စေရန် ၎င်းကို တပ်ဆင်ပေးပါသည်။

ထို့အပြင်၊ လေ့ကျင့်ရေးအဆင့်အတွင်း၊ မူဘောင်တွင် အသုံးပြုသူထည့်သွင်းသည့်ပုံကြားရှိ မျက်နှာ ID ကွာဟချက်နှင့် လေ့ကျင့်သင်ကြားထားသည့် LoRA မော်ဒယ်မှ ထုတ်လုပ်ထားသည့် အတည်ပြုပုံတို့ကို ဘောင်ကတွက်ချက်ပေးသည့် အရေးကြီးသောအတည်ပြုချက်အဆင့်တစ်ခုပါဝင်ပါသည်။ အတည်ပြုခြင်းအဆင့်သည် LoRA မော်ဒယ်များ၏ ပေါင်းစပ်မှုကို ရရှိစေရန်အတွက် အဓိကအခန်းကဏ္ဍမှ ပါဝင်သည့် အခြေခံလုပ်ငန်းစဉ်ဖြစ်ပြီး၊ နောက်ဆုံးတွင် သေချာစေရန်၊ လေ့ကျင့်ထားသော LoRA မူဘောင် doppelganger သို့မဟုတ် အသုံးပြုသူ၏ တိကျသော ဒစ်ဂျစ်တယ်ကိုယ်စားပြုမှုအဖြစ် ပြောင်းလဲသည်။ ထို့အပြင်၊ အကောင်းဆုံး face_id ရမှတ်ပါရှိသော အတည်ပြုပုံအား face_id ပုံအဖြစ် ရွေးချယ်မည်ဖြစ်ပြီး၊ ထို့နောက်တွင် ဤ face_id ပုံအား ဝင်ရောက်စွက်ဖက်မှုမျိုးဆက်၏ အထောက်အထားတူညီမှုကို မြှင့်တင်ရန်အတွက် အသုံးပြုမည်ဖြစ်သည်။

အစုလိုက်အပြုံလိုက် လုပ်ငန်းစဉ်အပေါ် အခြေခံ၍ မူဘောင်သည် LoRA မော်ဒယ်များအား ဖြစ်နိုင်ခြေ ခန့်မှန်းခြေကို မူလရည်မှန်းချက်အဖြစ် လေ့ကျင့်ပေးသည်၊၊ မျက်နှာအသွင်သဏ္ဍာန် ဆင်တူယိုးမှားကို ထိန်းသိမ်းခြင်းသည် ရေစုန်မျော်လင့်ချက်ဖြစ်သည်။ ဤပြဿနာကိုကိုင်တွယ်ဖြေရှင်းရန်၊ EasyPhoto framework သည် downstream objective ကိုတိုက်ရိုက်အကောင်းဆုံးဖြစ်အောင်ပြုလုပ်ရန် အားဖြည့်သင်ကြားရေးနည်းပညာများကိုအသုံးပြုသည်။ ရလဒ်အနေဖြင့် LoRA မော်ဒယ်များသည် ပုံစံပလိတ်မှ ထုတ်ပေးသောရလဒ်များကြား ပိုမိုကောင်းမွန်သော ဆင်တူမှုများကို ဖြစ်ပေါ်စေသည့် ပြသမှုဆိုင်ရာ တိုးတက်မှုကို လေ့လာနိုင်ပြီး၊ နမူနာပုံစံများတစ်လျှောက် ယေဘုယျလုပ်ဆောင်မှုကိုလည်း သရုပ်ပြသည်။

နှောင့်ယှက်ခြင်း လုပ်ငန်းစဉ်

အောက်ဖော်ပြပါပုံသည် EasyPhoto မူဘောင်ရှိ User ID တစ်ဦးချင်းစီအတွက် ဝင်ရောက်စွက်ဖက်ခြင်းလုပ်ငန်းစဉ်ကို သရုပ်ပြပြီး အပိုင်းသုံးပိုင်းခွဲထားသည်။

မျက်နှာအကြိုလုပ်ဆောင်မှု ControlNet ရည်ညွှန်းချက်ရယူရန်အတွက်၊ နှင့် ကြိုတင်လုပ်ဆောင်ထားသော ထည့်သွင်းပုံ။

ပထမဦးစွာ Diffusion ၎င်းသည် အသုံးပြုသူထည့်သွင်းမှုပုံစံနှင့်တူသော ကြမ်းတမ်းသောရလဒ်များကို ဖန်တီးရာတွင် ကူညီပေးသည်။

ဒုတိယ ပျံ့နှံ့ခြင်း။ ၎င်းသည် နယ်နိမိတ်အတွင်းရှိ ရှေးဟောင်းပစ္စည်းများကို ပြုပြင်ပေးသောကြောင့် ပုံများကို ပိုမိုတိကျစေပြီး ပိုမိုလက်တွေ့ကျစေသည်။

ထည့်သွင်းမှုအတွက်၊ framework သည် face_id ပုံ (အကောင်းဆုံး face_id ရမှတ်ကို အသုံးပြု၍ လေ့ကျင့်ရေးအတည်ပြုချက်တွင် ဖန်တီးထားသည့်) နှင့် စွက်ဖက်မှုပုံစံတစ်ခုယူပါသည်။ အထွက်သည် သုံးစွဲသူ၏ အလွန်အသေးစိတ်၊ တိကျပြီး လက်တွေ့ကျသော ပုံတူဖြစ်ပြီး၊ ကောက်ချက်ဆွဲသည့်ပုံစံကို အခြေခံ၍ အသုံးပြုသူ၏ အထောက်အထားနှင့် ထူးခြားသောအသွင်အပြင်နှင့် အနီးကပ်တူသည်။ ဒီလုပ်ငန်းစဉ်တွေကို အသေးစိတ်လေ့လာကြည့်ရအောင်။

မျက်နှာအကြိုလုပ်ဆောင်မှု

အသိစိတ်မဆင်ခြင်ဘဲ ဝင်ရောက်စွက်ဖက်မှုပုံစံတစ်ခုကို အခြေခံ၍ AI ပုံတူရုပ်ပုံတစ်ပုံကို ဖန်တီးရန်နည်းလမ်းမှာ အနှောင့်အယှက်ပုံစံပုံစံတွင် မျက်နှာဧရိယာကို ခြယ်မှုန်းရန် SD မော်ဒယ်ကို အသုံးပြုခြင်းဖြစ်သည်။ ထို့အပြင်၊ လုပ်ငန်းစဉ်တွင် ControlNet မူဘောင်ကို ထည့်သွင်းခြင်းသည် အသုံးပြုသူအထောက်အထားကို ထိန်းသိမ်းထားရုံသာမက ထုတ်လုပ်လိုက်သော ပုံများကြား တူညီမှုကိုလည်း တိုးမြှင့်ပေးပါသည်။ သို့ရာတွင်၊ ဒေသဆိုင်ရာ ဆေးခြယ်ခြင်းအတွက် ControlNet ကို တိုက်ရိုက်အသုံးပြုခြင်းဖြင့် ပါဝင်နိုင်သည့် အလားအလာရှိသော ပြဿနာများကို မိတ်ဆက်နိုင်သည်။

Input နှင့် Generated Image အကြား မကိုက်ညီမှု နမူနာပုံရှိ အဓိကအချက်များသည် face_id ပုံရှိ အဓိကအချက်များနှင့် မကိုက်ညီကြောင်း ထင်ရှားသောကြောင့် ကိုးကားချက်အဖြစ် Face_id ပုံနှင့်အတူ ControlNet ကို အသုံးပြုခြင်းသည် အထွက်တွင် ကွဲလွဲမှုအချို့ကို ဖြစ်ပေါ်စေနိုင်သည်။

Inpaint Region ရှိ ချို့ယွင်းချက်များ ဒေသတစ်ခုကို ဖုံးအုပ်ထားပြီး မျက်နှာအသစ်ဖြင့် ဆေးခြယ်ခြင်းသည် အထူးသဖြင့် ထုတ်လုပ်လိုက်သော ပုံ၏ စစ်မှန်မှုကိုသာမက ရုပ်ပုံ၏ လက်တွေ့ဆန်မှုကိုပါ ထိခိုက်စေမည့် ရောင်ခြယ်နယ်နိမိတ်တစ်လျှောက် သိသာထင်ရှားသော ချို့ယွင်းချက်များကို ဖြစ်ပေါ်စေနိုင်သည်။
Control Net မှ Identity Loss: လေ့ကျင့်ရေးလုပ်ငန်းစဉ်သည် ControlNet မူဘောင်ကို အသုံးမပြုသောကြောင့်၊ ဝင်ရောက်စွက်ဖက်မှုအဆင့်အတွင်း ControlNet ကိုအသုံးပြုခြင်းသည် ထည့်သွင်းအသုံးပြုသူ id အထောက်အထားကို ထိန်းသိမ်းရန် လေ့ကျင့်ထားသော LoRA မော်ဒယ်များ၏ စွမ်းရည်ကို ထိခိုက်စေနိုင်သည်။

အထက်ဖော်ပြပါ ပြဿနာများကို ကိုင်တွယ်ဖြေရှင်းရန် EasyPhoto မူဘောင်သည် လုပ်ထုံးလုပ်နည်းသုံးရပ်ကို အဆိုပြုပါသည်။

ညှိပြီး ကူးထည့်ပါ မျက်နှာကပ်ခြင်းဆိုင်ရာ အယ်လဂိုရီသမ်ကို အသုံးပြုခြင်းဖြင့်၊ EasyPhoto မူဘောင်သည် face ID နှင့် နမူနာပုံစံကြားရှိ မျက်နှာအမှတ်အသားများကြားတွင် မကိုက်ညီသည့်ပြဿနာကို ဖြေရှင်းရန် ရည်ရွယ်သည်။ ပထမဦးစွာ၊ မော်ဒယ်သည် face_id ၏ မျက်နှာအထင်ကရများနှင့် ပုံစံခွက်ရုပ်ပုံများကို တွက်ချက်ပြီး မော်ဒယ်သည် ပုံစံပလိတ်ပုံ၏ မျက်နှာအထင်ကရများကို face_id ပုံနှင့် ချိန်ညှိရန်အတွက် အသုံးပြုမည့် affine transformation matrix ကို ဆုံးဖြတ်ပေးသည်။ ရလာသောပုံသည် face_id ပုံ၏ တူညီသောမှတ်တိုင်များကို ထိန်းသိမ်းထားပြီး နမူနာပုံနှင့်လည်း ချိန်ညှိထားသည်။

မျက်နှာ Fuse Face Fuse သည် မျက်နှာဖုံးဆေးခြယ်ခြင်း၏ ရလဒ်ဖြစ်သည့် နယ်နိမိတ်ရှိ ရှေးဟောင်းပစ္စည်းများကို ပြုပြင်ရန်အတွက် အသုံးပြုသည့် ဆန်းသစ်သောချဉ်းကပ်မှုတစ်ခုဖြစ်ပြီး ၎င်းတွင် ControlNet မူဘောင်ကို အသုံးပြု၍ ရှေးဟောင်းပစ္စည်းများ ပြန်လည်ပြင်ဆင်ခြင်းလည်း ပါဝင်သည်။ နည်းလမ်းသည် EasyPhoto မူဘောင်အား သဟဇာတရှိသော အစွန်းများကို ထိန်းသိမ်းထားရန် သေချာစေပြီး၊ ထို့ကြောင့် ရုပ်ပုံထုတ်လုပ်ခြင်း လုပ်ငန်းစဉ်ကို အဆုံးစွန်ထိ လမ်းညွှန်ပေးသည်။ face fusion algorithm သည် roop (ground truth user images) image နှင့် template ကို ပေါင်းစပ်ထားသော image နှင့် edge boundaries များ၏ ပိုမိုကောင်းမွန်သော တည်ငြိမ်မှုကို ပြသနိုင်စေရန် ခွင့်ပြုပေးသည်၊ ထို့နောက် ပထမ diffusion အဆင့်တွင် ပိုမိုကောင်းမွန်သော output တစ်ခုဆီသို့ ဦးတည်စေသည်။
ControlNet လမ်းညွှန် မှန်ကန်မှု- LoRA မော်ဒယ်များကို ControlNet မူဘောင်ကို အသုံးပြု၍ လေ့ကျင့်မသင်ကြားထားသောကြောင့် ကောက်ချက်ချခြင်းလုပ်ငန်းစဉ်အတွင်း ၎င်းကိုအသုံးပြုခြင်းသည် LoRA မော်ဒယ်၏ အထောက်အထားများကို ထိန်းသိမ်းထားနိုင်မှုအပေါ် သက်ရောက်မှုရှိနိုင်သည်။ EasyPhoto ၏ ယေဘူယျလုပ်ဆောင်နိုင်စွမ်းကို မြှင့်တင်ရန်အတွက် မူဘောင်သည် ControlNet မူဘောင်၏ လွှမ်းမိုးမှုကို ထည့်သွင်းစဉ်းစားပြီး အဆင့်အမျိုးမျိုးမှ LoRA မော်ဒယ်များကို ပေါင်းစပ်ထားသည်။

ပထမဦးစွာ Diffusion

ပထမပျံ့နှံ့မှုအဆင့်သည် ထည့်သွင်းအသုံးပြုသူ ID နှင့် ဆင်တူသည့် သီးသန့်အိုင်ဒီတစ်ခုဖြင့် ပုံတစ်ပုံကို ဖန်တီးရန် နမူနာပုံစံကို အသုံးပြုသည်။ ထည့်သွင်းပုံသည် အသုံးပြုသူထည့်သွင်းသည့်ပုံနှင့် နမူနာပုံ၏ ပေါင်းစပ်မှုဖြစ်ပြီး၊ ချိန်ညှိထားသည့် မျက်နှာဖုံးသည် ထည့်သွင်းမှုမျက်နှာဖုံးဖြစ်သည်။ ရုပ်ပုံထုတ်လုပ်ခြင်းအပေါ် ပိုမိုထိန်းချုပ်နိုင်စေရန်၊ EasyPhoto မူဘောင်သည် ပထမ ControlNet ယူနစ်သည် ပေါင်းစပ်ထားသောပုံများ၏ထိန်းချုပ်မှုကိုအာရုံစိုက်သည့် ControlNet ယူနစ်သုံးခုကို ပေါင်းစပ်ထားပြီး၊ ဒုတိယ ControlNet ယူနစ်သည် ပေါင်းစပ်ထားသောရုပ်ပုံ၏အရောင်များကိုထိန်းချုပ်ပြီး နောက်ဆုံး ControlNet ယူနစ်သည် ပွင့်လင်းမြင်သာမှုရှိသည် နမူနာပုံ၏ မျက်နှာဖွဲ့စည်းပုံသာမက အသုံးပြုသူ၏ မျက်နှာသွင်ပြင်လက္ခဏာပါရှိသော အစားထိုးထားသော ပုံ၏ (အချိန်နှင့်တပြေးညီ လူပေါင်းများစွာ လူသားပုံပြထိန်းချုပ်မှု)။

ဒုတိယ ပျံ့နှံ့ခြင်း။

ဒုတိယပျံ့နှံမှုအဆင့်တွင်၊ သီးသန့်ဧရိယာအတွင်း မျိုးဆက်များ၏ ထိရောက်မှုကို မြှင့်တင်ရန် ကြိုးပမ်းရာတွင် အသုံးပြုသူများအား ပုံရှိ သီးခြားဒေသတစ်ခုကို ဖုံးအုပ်ရန် လိုက်လျောညီထွေရှိမှုနှင့်အတူ အသုံးပြုသူများအား မျက်နှာ၏နယ်နိမိတ်အနီးရှိ ရှေးဟောင်းပစ္စည်းများကို သန့်စင်ပြီး ကောင်းမွန်စွာ ချိန်ညှိထားသည်။ ဤအဆင့်တွင်၊ framework သည် ပထမ diffusion အဆင့်မှရရှိသော output image ကို roop image သို့မဟုတ် user's image ၏ရလဒ်နှင့် ပေါင်းစပ်ပြီး ဒုတိယ diffusion အဆင့်အတွက် input image ကိုထုတ်ပေးပါသည်။ ယေဘုယျအားဖြင့်၊ ဒုတိယပျံ့နှံ့မှုအဆင့်သည် အလုံးစုံအရည်အသွေးနှင့် ထုတ်လုပ်ထားသောပုံ၏အသေးစိတ်အချက်အလက်များကို မြှင့်တင်ရာတွင် အရေးပါသောအခန်းကဏ္ဍမှ ပါဝင်ပါသည်။

အသုံးပြုသူ ID အများအပြား

EasyPhoto ၏ထူးခြားချက်တစ်ခုမှာ သုံးစွဲသူ ID အများအပြားကို ဖန်တီးရန် ၎င်း၏ပံ့ပိုးမှုဖြစ်ပြီး၊ အောက်ဖော်ပြပါပုံသည် EasyPhoto မူဘောင်ရှိ သုံးစွဲသူ ID အများအပြားအတွက် အနှောင့်အယှက်ပေးသည့်လုပ်ငန်းစဉ်၏ ပိုက်လိုင်းကို သရုပ်ပြသည်။

Multi-user ID မျိုးဆက်အတွက် ပံ့ပိုးမှုပေးရန်၊ EasyPhoto framework သည် နှောက်ယှက်မှုပုံစံပုံစံတွင် မျက်နှာထောက်လှမ်းမှုကို ဦးစွာလုပ်ဆောင်သည်။ ယင်းနှောင့်ယှက်မှုပုံစံများကို မျက်နှာဖုံးတစ်ခုစီတွင် မျက်နှာတစ်ခုတည်းသာပါရှိသော မြောက်မြားစွာသောမျက်နှာဖုံးများအဖြစ် ပိုင်းခြားထားပြီး ကျန်ပုံတစ်ပုံကို အဖြူရောင်ဖြင့် ဖုံးအုပ်ထားသောကြောင့် သုံးစွဲသူအများအပြား ID မျိုးဆက်ကို တစ်ဦးချင်းအသုံးပြုသူ ID များထုတ်ပေးခြင်း၏ ရိုးရှင်းသောအလုပ်အဖြစ်သို့ ခွဲသွားပါသည်။ framework သည် အသုံးပြုသူ ID ပုံများကို ထုတ်ပေးသည်နှင့်တပြိုင်နက် ဤပုံများကို အနုမာနပုံစံပလိတ်သို့ ပေါင်းစည်းလိုက်ခြင်းဖြင့် ထုတ်လုပ်လိုက်သော ပုံများနှင့် ချောမွေ့စွာ ပေါင်းစပ်နိုင်စေကာ နောက်ဆုံးတွင် အရည်အသွေးမြင့် ရုပ်ပုံဖြစ်လာစေမည်ဖြစ်သည်။

စမ်းသပ်မှုများနှင့် ရလဒ်များ

ယခု ကျွန်ုပ်တို့တွင် EasyPhoto မူဘောင်ကို နားလည်သဘောပေါက်ထားပြီး၊ EasyPhoto မူဘောင်၏ စွမ်းဆောင်ရည်ကို လေ့လာရန် အချိန်တန်ပြီဖြစ်သည်။

အထက်ဖော်ပြပါပုံကို EasyPhoto ပလပ်အင်မှ ထုတ်လုပ်ထားပြီး၊ ၎င်းသည် ရုပ်ပုံထုတ်လုပ်ရန်အတွက် စတိုင်အခြေခံ SD မော်ဒယ်ကို အသုံးပြုထားသည်။ သတိပြုနိုင်သကဲ့သို့ ထုတ်လုပ်လိုက်သော ပုံများသည် လက်တွေ့ဆန်ပြီး အလွန်တိကျပါသည်။

အထက်ဖော်ပြပါပုံအား Comic Style အခြေခံ SD မော်ဒယ်ကို အသုံးပြု၍ EasyPhoto framework မှ ထုတ်ပေးပါသည်။ ၎င်းကို မြင်တွေ့နိုင်သကဲ့သို့ ရုပ်ပြဓာတ်ပုံများနှင့် လက်တွေ့ဆန်သော ဓာတ်ပုံများသည် အလွန်လက်တွေ့ဆန်ပြီး အသုံးပြုသူ၏တောင်းဆိုချက်များ သို့မဟုတ် လိုအပ်ချက်များအပေါ် အခြေခံ၍ ထည့်သွင်းထားသောပုံနှင့် နီးကပ်စွာ ဆင်တူသည်။

အောက်ဖော်ပြပါပုံတွင် ထည့်သွင်းထားသောပုံကို EasyPhoto framework မှ Multi-Person template ကိုအသုံးပြုခြင်းဖြင့် ဖန်တီးထားပါသည်။ ရှင်းရှင်းလင်းလင်းမြင်ရသောကြောင့် ထုတ်လုပ်လိုက်သောပုံများသည် ရှင်းရှင်းလင်းလင်း၊ တိကျပြီး မူရင်းပုံနှင့်တူသည်။

EasyPhoto ၏အကူအညီဖြင့်၊ အသုံးပြုသူများသည် ယခုအခါတွင် ကျယ်ပြန့်သော AI ပုံတူပုံများကို ဖန်တီးနိုင်သည်၊ သို့မဟုတ် ထိန်းသိမ်းထားသော နမူနာပုံစံများကို အသုံးပြု၍ အသုံးပြုသူ ID အများအပြားကို ဖန်တီးနိုင်သည်၊ သို့မဟုတ် အနုမာနတင်းပလိတ်များကို ဖန်တီးရန်အတွက် SD မော်ဒယ်ကို အသုံးပြုနိုင်သည်။ အထက်ဖော်ပြပါပုံများသည် ကွဲပြားပြီး အရည်အသွေးမြင့် AI ရုပ်ပုံများကို ထုတ်လုပ်ရာတွင် EasyPhoto framework ၏ စွမ်းရည်ကို ပြသသည်။

ကောက်ချက်

ဤဆောင်းပါးတွင်၊ ကျွန်ုပ်တို့သည် EasyPhoto၊ a ဝတ္ထု WebUI ပလပ်အင် ၎င်းသည် သုံးစွဲသူများအား AI ပုံတူများနှင့် ပုံများကို ဖန်တီးနိုင်စေပါသည်။ EasyPhoto WebUI ပလပ်အင်သည် မတရားသော နမူနာပုံစံများကို အသုံးပြု၍ AI ပုံတူများကို ထုတ်ပေးပြီး EasyPhoto WebUI ၏ လက်ရှိသက်ရောက်မှုများသည် မတူညီသောဓာတ်ပုံစတိုင်များနှင့် ပြုပြင်မွမ်းမံမှုများစွာကို ပံ့ပိုးပေးပါသည်။ ထို့အပြင်၊ EasyPhoto ၏စွမ်းရည်များကို ပိုမိုမြှင့်တင်ရန်၊ အသုံးပြုသူများသည် ပိုမိုကျေနပ်ဖွယ်ကောင်းသော၊ တိကျပြီး ကွဲပြားသောပုံများထုတ်လုပ်ရန် SDXL မော်ဒယ်ကို အသုံးပြု၍ ပုံများဖန်တီးရာတွင် ပြောင်းလွယ်ပြင်လွယ်ရှိသည်။ EasyPhoto framework သည် အရည်အသွေးမြင့် ရုပ်ပုံအထွက်များကို ထုတ်လုပ်ပေးသည့် ကြိုတင်လေ့ကျင့်ထားသော LoRA မော်ဒယ်နှင့် ပေါင်းစပ်ထားသော တည်ငြိမ်သော diffusion base model ကို အသုံးပြုသည်။

ရုပ်ပုံဂျင်နရေတာများကို စိတ်ဝင်စားပါသလား။ ကျွန်ုပ်တို့၏စာရင်းကိုလည်းပေးပါသည်။ အကောင်းဆုံး AI Headshot Generators နှင့် အကောင်းဆုံး AI Image Generators အသုံးပြုရလွယ်ကူပြီး နည်းပညာပိုင်းဆိုင်ရာကျွမ်းကျင်မှုမလိုအပ်ပါ။

Related ခေါင်းစဉ်များ:လွယ်ကူသောဓာတ်ပုံ

Next ကို up ကို

ChatDev - ဆော့ဖ်ဝဲလ်ဖွံ့ဖြိုးတိုးတက်မှုအတွက် ဆက်သွယ်ရေးအေးဂျင့်များ

သတိရနေတယ်မနေပါနဲ့

AI တွင် Google ၏ မဟာဗျူဟာမြောက် ချဲ့ထွင်မှု- Anthropic အတွက် $2 ဘီလီယံ အလောင်းအစား

Kunal Kejriwal

"အသက်မွေးဝမ်းကြောင်းပြုသော အင်ဂျင်နီယာ၊ နှလုံးသားဖြင့် စာရေးဆရာ"။ Kunal သည် AI နှင့် ML တို့ကို နက်နက်ရှိုင်းရှိုင်း ချစ်မြတ်နိုးပြီး နားလည်မှုရှိသော နည်းပညာစာရေးဆရာတစ်ဦးဖြစ်ပြီး ဤနယ်ပယ်များရှိ ရှုပ်ထွေးသောအယူအဆများကို ရိုးရှင်းလွယ်ကူစေရန် ရည်ရွယ်၍ ၎င်း၏ပါဝင်ပတ်သက်မှုနှင့် သတင်းအချက်အလက်ဆိုင်ရာ စာရွက်စာတမ်းများမှတစ်ဆင့် သိရသည်။