Yapay Zeka

EasyPhoto: Kişisel Yapay Zeka Fotoğraf Oluşturucunuz

Güncellenmiş on 30 Ekim 2023

EasyPhoto: Kişisel Yapay Zekalı Portre Oluşturucunuz

Kararlı Difüzyon Web Kullanıcı Arayüzü veya SD-WebUI, bir tarayıcı arayüzü sağlamak için Gradio kütüphanesini kullanan Stabil Difüzyon modelleri için kapsamlı bir projedir. Bugün, son kullanıcıların yapay zeka portreleri ve görüntüleri oluşturmasına olanak tanıyan yenilikçi bir WebUI eklentisi olan EasyPhoto'dan bahsedeceğiz. EasyPhoto WebUI eklentisi, çeşitli şablonlar kullanarak, farklı fotoğraf stillerini ve çoklu değişiklikleri destekleyen AI portreleri oluşturur. Ek olarak, EasyPhoto'nun yeteneklerini daha da geliştirmek amacıyla kullanıcılar, daha tatmin edici, doğru ve çeşitli sonuçlar için SDXL modelini kullanarak görüntüler oluşturabilirler. Hadi başlayalım.

EasyPhoto ve Kararlı Difüzyona Giriş

Stabil Difüzyon çerçevesi, geliştiriciler tarafından giriş metni açıklamalarına dayalı olarak gerçekçi görüntüler oluşturmak için kullanılan popüler ve sağlam bir yayılma tabanlı oluşturma çerçevesidir. Yetenekleri sayesinde Stabil Difüzyon çerçevesi, görüntünün dış boyama, görüntü iç boyama ve görüntüden görüntüye çeviri dahil olmak üzere geniş bir uygulama yelpazesine sahiptir. Stable Diffusion Web UI veya SD-WebUI, bu çerçevenin en popüler ve bilinen uygulamalarından biri olarak öne çıkıyor. Stabil Difüzyon modelleri için etkileşimli ve kullanıcı dostu bir arayüz sağlayan, Gradio kütüphanesi üzerine kurulu bir tarayıcı arayüzüne sahiptir. Görüntü oluşturmada kontrolü ve kullanılabilirliği daha da geliştirmek için SD-WebUI çok sayıda Stabil Difüzyon uygulamasını entegre eder.

SD-WebUI çerçevesinin sunduğu kolaylık nedeniyle EasyPhoto çerçevesinin geliştiricileri, onu tam teşekküllü bir uygulama yerine bir web eklentisi olarak oluşturmaya karar verdiler. Genellikle kimlik kaybına uğrayan veya görüntülere gerçekçi olmayan özellikler katan mevcut yöntemlerin aksine EasyPhoto çerçevesi, doğru ve gerçekçi görüntüler üretmek için Stabil Difüzyon modellerinin görüntüden görüntüye yeteneklerinden yararlanır. Kullanıcılar EasyPhoto çerçevesini WebUI içinde bir uzantı olarak kolayca yükleyebilir, böylece kullanıcı dostu olma özelliği ve daha geniş bir kullanıcı yelpazesi için erişilebilirlik geliştirilebilir. EasyPhoto çerçevesi, kullanıcıların kimlik yönlendirmeli, yüksek kaliteli ve gerçekçi yapay zeka portreleri giriş kimliğine çok benzer.

İlk olarak EasyPhoto çerçevesi, kullanıcılardan bir yüz LoRA veya Düşük Sıralı Adaptasyon modelini çevrimiçi olarak eğitmek için birkaç görüntü yükleyerek dijital benzerlerini oluşturmalarını ister. LoRA çerçevesi, düşük dereceli uyarlama teknolojisinden yararlanarak yayılma modellerinde hızlı bir şekilde ince ayar yapar. Bu süreç, temel alınan modelin belirli kullanıcıların kimlik bilgilerini anlamasına olanak tanır. Eğitilen modeller daha sonra birleştirilir ve girişim için temel Kararlı Difüzyon modeline entegre edilir. Ayrıca, girişim süreci sırasında model, girişim şablonundaki yüz bölgelerini yeniden boyamak amacıyla kararlı difüzyon modelleri kullanır ve giriş ve çıkış görüntüleri arasındaki benzerlik çeşitli ControlNet birimleri kullanılarak doğrulanır.

EasyPhoto çerçevesi aynı zamanda sınır kusurları ve kimlik kaybı gibi olası sorunların üstesinden gelmek için iki aşamalı bir yayılma sürecini de kullanıyor, böylece oluşturulan görüntülerin kullanıcının kimliğini korurken görsel tutarsızlıkları en aza indirmesini sağlıyor. Ayrıca EasyPhoto çerçevesindeki girişim hattı yalnızca portreler oluşturmakla sınırlı değildir, aynı zamanda kullanıcının kimliğiyle ilgili her şeyi oluşturmak için de kullanılabilir. Bu şu anlama geliyor: Bir kez eğittiğinizde LoRA modeli Belirli bir kimlik için geniş bir yelpazede AI resimleri oluşturabilirsiniz ve böylece sanal denemeler de dahil olmak üzere yaygın uygulamalara sahip olabilirsiniz.

EasyPhoto çerçevesini özetleyin

Oluşturulan görüntülerin yüze uygunluğunu korumak için birden fazla LoRA modelini birleştirerek LoRA modelini eğitmek için yeni bir yaklaşım önerir.
Yüz kimliği ödülleri için LoRA modellerini optimize etmek amacıyla çeşitli takviyeli öğrenme yöntemlerinden yararlanır; bu, eğitim görüntüleri ile oluşturulan sonuçlar arasındaki kimlik benzerliğini daha da artırmaya yardımcı olur.
Yüksek estetiğe ve benzerliğe sahip yapay zeka fotoğrafları oluşturmayı amaçlayan, çift aşamalı, iç boya tabanlı bir yayılma süreci önerir.

EasyPhoto : Mimarlık ve Eğitim

Aşağıdaki şekil EasyPhoto AI çerçevesinin eğitim sürecini göstermektedir.

Görüldüğü gibi framework öncelikle kullanıcılardan eğitim görsellerini girmelerini istiyor ve daha sonra yüz konumlarını tespit etmek için yüz tespiti gerçekleştiriyor. Çerçeve yüzü algıladıktan sonra, yalnızca yüz bölgesine odaklanan önceden tanımlanmış belirli bir oranı kullanarak girdi görüntüsünü kırpar. Çerçeve daha sonra temiz ve net bir yüz eğitimi görüntüsü elde etmek için bir cilt güzelleştirme ve bir belirginlik tespit modeli kullanır. Bu iki model, yüzün görsel kalitesinin arttırılmasında çok önemli bir rol oynuyor ve aynı zamanda arka plan bilgilerinin kaldırılmasını ve eğitim görüntüsünün ağırlıklı olarak yüzü içermesini sağlıyor. Son olarak çerçeve, LoRA modelini eğitmek ve böylece kullanıcıya özgü yüz özelliklerini daha etkili ve doğru bir şekilde kavrama yeteneği ile donatmak için bu işlenmiş görüntüleri ve giriş istemlerini kullanır.

Ayrıca, eğitim aşaması sırasında çerçeve, çerçevenin kullanıcı giriş görüntüsü ile eğitilen LoRA modeli tarafından oluşturulan doğrulama görüntüsü arasındaki yüz kimliği boşluğunu hesapladığı kritik bir doğrulama adımını içerir. Doğrulama adımı, LoRA modellerinin birleşiminin sağlanmasında önemli bir rol oynayan ve sonuçta eğitimli LoRA çerçevesi bir doppelganger'a veya kullanıcının doğru bir dijital temsiline dönüşür. Ek olarak, optimal face_id puanına sahip doğrulama görüntüsü face_id görüntüsü olarak seçilecek ve bu face_id görüntüsü daha sonra girişim oluşturmanın kimlik benzerliğini geliştirmek için kullanılacaktır.

Topluluk sürecine dayalı olarak ilerleyen çerçeve, birincil amaç olasılık tahmini olacak şekilde LoRA modellerini eğitirken, alt hedef ise yüz kimliği benzerliğini korumaktır. Bu sorunun üstesinden gelmek için EasyPhoto çerçevesi, aşağı yönlü hedefi doğrudan optimize etmek amacıyla takviyeli öğrenme tekniklerinden yararlanır. Sonuç olarak, LoRA modellerinin öğrendiği yüz özellikleri, şablonla oluşturulan sonuçlar arasında gelişmiş bir benzerliğe yol açan ve aynı zamanda şablonlar arasında genellemeyi gösteren bir gelişme gösterir.

Girişim Süreci

Aşağıdaki şekil, EasyPhoto çerçevesindeki bireysel bir Kullanıcı Kimliğine yönelik müdahale sürecini göstermektedir ve üç bölüme ayrılmıştır

Yüz Ön İşlemi ControlNet referansını ve önceden işlenmiş giriş görüntüsünü elde etmek için.

İlk Difüzyon Bu, kullanıcı girişine benzeyen kaba sonuçlar oluşturmaya yardımcı olur.

İkinci Difüzyon Bu, sınır kusurlarını düzelterek görüntülerin daha doğru olmasını ve daha gerçekçi görünmesini sağlar.

Giriş için çerçeve, bir face_id görüntüsünü (en uygun face_id puanı kullanılarak eğitim doğrulaması sırasında oluşturulan) ve bir girişim şablonunu alır. Çıktı, kullanıcının son derece ayrıntılı, doğru ve gerçekçi bir portresidir ve çıkarım şablonu temelinde kullanıcının kimliğine ve benzersiz görünümüne yakından benzemektedir. Gelin bu süreçlere detaylı olarak bakalım.

Yüz Ön İşlemi

Bilinçli akıl yürütme olmaksızın girişim şablonuna dayalı bir yapay zeka portresi oluşturmanın bir yolu, girişim şablonundaki yüz bölgesini yeniden boyamak için SD modelini kullanmaktır. Ek olarak, ControlNet çerçevesini sürece eklemek yalnızca kullanıcı kimliğinin korunmasını geliştirmekle kalmaz, aynı zamanda oluşturulan görüntüler arasındaki benzerliği de artırır. Ancak bölgesel iç boyama için ControlNet'in doğrudan kullanılması aşağıdakileri içerebilecek olası sorunları ortaya çıkarabilir:

Girdi ile Oluşturulan Görüntü Arasındaki Tutarsızlık: Şablon görüntüsündeki anahtar noktaların face_id görüntüsündeki anahtar noktalarla uyumlu olmadığı açıktır, bu nedenle ControlNet'i face_id görüntüsüyle referans olarak kullanmak çıktıda bazı tutarsızlıklara yol açabilir.

Inpaint Bölgesindeki Kusurlar : Bir bölgenin maskelenmesi ve daha sonra yeni bir yüzle yeniden boyanması, özellikle iç boyama sınırı boyunca gözle görülür kusurlara yol açabilir; bu, yalnızca oluşturulan görüntünün orijinalliğini etkilemekle kalmayacak, aynı zamanda görüntünün gerçekçiliğini de olumsuz yönde etkileyecektir.
Kontrol Ağı Nedeniyle Kimlik Kaybı: Eğitim süreci ControlNet çerçevesini kullanmadığından, müdahale aşamasında ControlNet'in kullanılması, eğitilen LoRA modellerinin giriş kullanıcı kimliği kimliğini koruma yeteneğini etkileyebilir.

Yukarıda bahsedilen sorunların üstesinden gelmek için EasyPhoto çerçevesi üç prosedür önermektedir.

Hizala ve Yapıştır: EasyPhoto çerçevesi, bir yüz yapıştırma algoritması kullanarak, yüz kimliği ile şablon arasındaki yüz yer işaretleri arasındaki uyumsuzluk sorununu çözmeyi amaçlıyor. İlk olarak model, face_id ve şablon görüntüsünün yüz işaretlerini hesaplar, ardından model, şablon görüntüsünün yüz işaretlerini face_id görüntüsüyle hizalamak için kullanılacak afin dönüşüm matrisini belirler. Ortaya çıkan görüntü, face_id görüntüsünün aynı yer işaretlerini korur ve ayrıca şablon görüntüsüyle hizalanır.

Yüz Sigortası: Face Fuse, maske içi boyamanın bir sonucu olan sınır bozulmalarını düzeltmek için kullanılan yeni bir yaklaşımdır ve yapay oluşumların ControlNet çerçevesini kullanarak düzeltilmesini içerir. Yöntem, EasyPhoto çerçevesinin uyumlu kenarların korunmasını sağlamasına ve böylece sonuçta görüntü oluşturma sürecine rehberlik etmesine olanak tanır. Yüz füzyon algoritması ayrıca roop (yer gerçeği kullanıcı görüntüleri) görüntüsünü ve şablonu birleştirir, bu da elde edilen birleştirilmiş görüntünün kenar sınırlarının daha iyi stabilizasyonunu sergilemesine olanak tanır ve bu daha sonra ilk yayılma aşamasında gelişmiş bir çıktıya yol açar.
ControlNet destekli Doğrulama: LoRA modelleri ControlNet çerçevesi kullanılarak eğitilmediğinden çıkarım işlemi sırasında bu çerçevenin kullanılması LoRA modelinin kimlikleri koruma yeteneğini etkileyebilir. EasyPhoto'nun genelleştirme yeteneklerini geliştirmek için çerçeve, ControlNet çerçevesinin etkisini dikkate alır ve farklı aşamalardaki LoRA modellerini içerir.

İlk Difüzyon

İlk yayılma aşaması, giriş kullanıcı kimliğine benzeyen benzersiz bir kimliğe sahip bir görüntü oluşturmak için şablon görüntüsünü kullanır. Giriş görüntüsü, kullanıcı giriş görüntüsü ile şablon görüntüsünün bir birleşimidir; kalibre edilmiş yüz maskesi ise giriş maskesidir. Görüntü oluşturma üzerindeki kontrolü daha da artırmak için EasyPhoto çerçevesi, ilk ControlNet ünitesinin birleştirilmiş görüntülerin kontrolüne odaklandığı, ikinci ControlNet ünitesinin birleştirilmiş görüntünün renklerini kontrol ettiği ve son ControlNet ünitesinin açık konum olduğu üç ControlNet ünitesini entegre eder. Değiştirilen görüntünün (gerçek zamanlı çok kişili insan poz kontrolü), yalnızca şablon görüntünün yüz yapısını değil aynı zamanda kullanıcının yüz kimliğini de içerir.

İkinci Difüzyon

İkinci yayılma aşamasında, yüzün sınırına yakın yapay yapılar rafine edilir ve ince ayarlar yapılır ve kullanıcılara, söz konusu özel alan içindeki üretimin etkinliğini artırmak amacıyla görüntüdeki belirli bir bölgeyi maskeleme esnekliği sağlanır. Bu aşamada çerçeve, birinci difüzyon aşamasından elde edilen çıktı görüntüsünü roop görüntüsü veya kullanıcı görüntüsünün sonucuyla birleştirir ve böylece ikinci difüzyon aşaması için giriş görüntüsünü oluşturur. Genel olarak, ikinci yayılma aşaması, oluşturulan görüntünün genel kalitesinin ve ayrıntılarının geliştirilmesinde çok önemli bir rol oynar.

Çoklu Kullanıcı Kimlikleri

EasyPhoto'nun öne çıkan özelliklerinden biri, birden fazla kullanıcı kimliği oluşturma desteğidir ve aşağıdaki şekil, EasyPhoto çerçevesinde çok kullanıcılı kimliklere yönelik müdahale sürecinin boru hattını göstermektedir.

Çok kullanıcılı kimlik oluşturma desteği sağlamak için EasyPhoto çerçevesi ilk olarak girişim şablonunda yüz algılamayı gerçekleştirir. Bu girişim şablonları daha sonra çok sayıda maskeye bölünür; burada her maske yalnızca bir yüz içerir ve görüntünün geri kalanı beyaz renkte maskelenir, böylece çok kullanıcılı kimlik oluşturma işlemi, bireysel kullanıcı kimlikleri oluşturma gibi basit bir göreve bölünür. Çerçeve, kullanıcı kimliği görüntülerini oluşturduğunda, bu görüntüler çıkarım şablonuyla birleştirilir, böylece şablon görüntülerinin oluşturulan görüntülerle kusursuz bir şekilde entegrasyonu kolaylaştırılır ve sonuçta yüksek kaliteli bir görüntü elde edilir.

Deneyler ve Sonuçlar

Artık EasyPhoto çerçevesini anladığımıza göre, EasyPhoto çerçevesinin performansını keşfetmenin zamanı geldi.

Yukarıdaki görüntü EasyPhoto eklentisi tarafından oluşturulmuştur ve görüntü oluşturmak için Stil tabanlı bir SD modeli kullanır. Görülebileceği gibi, oluşturulan görüntüler gerçekçi görünüyor ve oldukça doğru.

Yukarıda eklenen görüntü EasyPhoto çerçevesi tarafından Comic Style tabanlı bir SD modeli kullanılarak oluşturulmuştur. Görüldüğü gibi, komik fotoğraflar ve gerçekçi fotoğraflar oldukça gerçekçi görünüyor ve kullanıcı istemleri veya gereksinimleri temelinde giriş görüntüsüne çok benziyor.

Aşağıda eklenen görüntü EasyPhoto çerçevesi tarafından Çok Kişili şablon kullanılarak oluşturulmuştur. Açıkça görülebileceği gibi, oluşturulan görüntüler net, doğru ve orijinal görüntüye benzemektedir.

EasyPhoto'nun yardımıyla kullanıcılar artık çok çeşitli AI portreleri oluşturabilir veya korunmuş şablonları kullanarak birden fazla kullanıcı kimliği oluşturabilir veya çıkarım şablonları oluşturmak için SD modelini kullanabilir. Yukarıda eklenen görüntüler EasyPhoto çerçevesinin çeşitli ve yüksek kaliteli yapay zeka resimleri üretme yeteneğini göstermektedir.

Sonuç

Bu yazımızda EasyPhoto'dan bahsettik. yeni WebUI eklentisi Bu, son kullanıcıların yapay zeka portreleri ve görüntüleri oluşturmasına olanak tanır. EasyPhoto WebUI eklentisi, rastgele şablonlar kullanarak AI portreleri oluşturur ve EasyPhoto WebUI'nin mevcut uygulamaları, farklı fotoğraf stillerini ve birden fazla değişikliği destekler. Ayrıca EasyPhoto'nun yeteneklerini daha da geliştirmek için kullanıcılar, daha tatmin edici, doğru ve çeşitli görüntüler oluşturmak üzere SDXL modelini kullanarak görüntüler oluşturma esnekliğine sahip oluyor. EasyPhoto çerçevesi, yüksek kaliteli görüntü çıktıları üreten, önceden eğitilmiş bir LoRA modeliyle birleştirilmiş kararlı bir yayılma temel modelini kullanır.

Görüntü oluşturucularla ilgileniyor musunuz? Ayrıca bunların bir listesini de sunuyoruz. En İyi Yapay Zeka Headshot Oluşturucuları ve En İyi Yapay Zeka Görüntü Oluşturucuları kullanımı kolaydır ve teknik uzmanlık gerektirmez.

İlgili konular:kolay fotoğraf

Bir sonraki

ChatDev: Yazılım Geliştirme için İletişimsel Aracılar

Kaçırmayın

Google'ın Yapay Zekada Stratejik Genişlemesi: Antropik Konusunda 2 Milyar Dolarlık Bahis

Kunal Kejriwal

"Meslek olarak bir mühendis, ezbere bir yazar". Kunal, yapay zeka ve makine öğrenimine derin bir sevgi ve anlayışa sahip, ilgi çekici ve bilgilendirici belgeleriyle bu alanlardaki karmaşık kavramları basitleştirmeye kendini adamış bir teknik yazardır.

Unite.AI

EasyPhoto: Kişisel Yapay Zeka Fotoğraf Oluşturucunuz

Yapay Zeka

EasyPhoto: Kişisel Yapay Zeka Fotoğraf Oluşturucunuz

Içindekiler

EasyPhoto ve Kararlı Difüzyona Giriş

EasyPhoto : Mimarlık ve Eğitim