Röportajlar
Ernest Piatrovich, ARTA’nın Ürün Müdürü – Röportaj Serisi

Ernest Piatrovich, AIBY Group‘ta Ürün Müdürüdür ve şirketin en üst düzey AI destekli uygulamalarından biri olan ARTA – iPhone ve Android için AI Görüntü Oluşturucu’yu yönetmektedir. Stratejik vizyonu ve yaratıcı düşünmesi, uygulamanın kısa süre sonra yayınlanmasının ardından US App Store’un üst sıralarında 2. sıraya ulaşmasını, dünya çapında 15 milyonun üzerinde indirme sayısını aşmasını ve benzersiz bir iç mekan boru hattı temelinde en iyi performans gösteren AI Avatar’ları sunmasını sağladı.
ARTA – AI Sanal Gerçeklik Oluşturucu’nu kavramlaşma aşamasından bu yana yönetmekten sorumlusunuz. Bu ilk günler hakkında bazı içgörüler paylaşabilir misiniz?
Elbette! O zamanlar dinamik zamanlardı. Sadece bir hafta içinde güzel bir uygulama yayınlamak için mobilde metin-görsel oluşturma işlevselliği sunan ilk tüketici uygulaması yaratıcılarından biri olduk. Amacımız, insanlara “ceplerinde bir sanatçı” sunan bir kütle pazarı ürünü oluşturmaktı. Böylece, kavramlaştırma ve erken gelişim aşamalarından itibaren, kullanışlılık ve ölçeklenebilirlik üzerinde odaklandık. Ancak, zamanında piyasaya girme rağmen, harika bir medya satın alma ekibimize rağmen, indirme hacmimizi yeterli bir düzeye çıkarmak oldukça zor oldu. Üç ay sonra uygulamanın yayınlanmasının ardından Avatar özelliğimiz popüler hale geldiğinde önemli bir artış yaşandı. Hacim, nişimiz için orta düzeyde yüksek oldu ve o günden beri görevimiz, bunu korumak ve artırmak oldu.
Orijinal teknoloji yığını nelerdi ve bu dönemde sanat oluşturma ile ilgili bazı zorluklar nelerdi?
Stability.ai’nin resmi API’sini kullanan Stable Diffusion 1.3 ile başladık. O zamanların ve şimdi olan sanat oluşturma kalitesi arasında büyük bir fark var. Başlangıçta, QA yöneticilerimiz sık sık görsel değer veya belirli kavram ve özelliklerin temsilindeki hatalarla ilgili sorunlar rapor etti. Ancak bu, o zamanlar Stable Diffusion için standarttı. Şimdi, görsel üretim çıktısı her yönüyle daha iyi: stilistik yeniden üretim, bileşim tutarlılığı, görsel Sadakat, ayrıntı düzeyi ve daha fazlası.
Uygulamanın yayınlanmasının kısa bir süre sonra Amazon’da sunucular kiraladık ve bunları desteklemek oldukça zor oldu. Yeterli fonlara sahip olsanız bile, ihtiyacınız olduğunda yeterli A100 olmayabilir ve birkaç gün beklemek zorunda kalabilirsiniz. Bu nedenle, otomatik ölçeklendirme olmadan, tüm fazla trafiği ortaklarımızın API’lerine yönlendirmek zorunda kaldık.
Bunların tümünü korumak hala oldukça zor. Her ay veya öyle bir şeyde küçük sorunlar ortaya çıkıyor. Örneğin, sunucu güncellerken, ağırlıkları test ederken veya görsel üretim çıkışını etkileyen diğer değişiklikleri uygularken geçici sorunlar yaşayabiliyoruz. Bu hatalar bir saatten yarım güne kadar sürebiliyor ve öngörülemez ve izlenmeleri zor. Genellikle, destek ekibimiz bir kullanıcıdan bulanık görseller veya başka bir sorun hakkında rapor aldığında, API sağlayıcısı zaten sorunu çözmüştür. Ancak bu, kullanıcılarımız için ciddi bir endişe kaynağıdır. Bu nedenle, şimdi birden fazla sağlayıcıyı ve özel görseller için kendi sunucularımızı birleştiren bir sistem oluşturuyoruz, böylece işlerin bizim tarafımızda daha fazla kontrolü sağlayabiliyoruz.
Ürün müdürü olarak, ARTA’yı yayınlanmasının kısa bir süre sonra üst sıralara taşıyan stratejik kararlar nelerdi?
ARTA’nın (o zamanlar Aiby olarak adlandırılan) erken yükselişi, sosyal medyada dolaşmaya başladığında viral Avatar özelliğini uygulamaya karar vermemizden kaynaklandı. Büyüyen ilgiyi nhanh chóng tanıdık. Ürün, pazarlama ve geliştirme ekiplerimiz, başarısından emin ve aynı vizyona sahipti. Ayrıca, kısa bir süre içinde pazara girme zamanının kritik olduğunu anladık. Bu nedenle, ilk günden itibaren tüm kaynaklarımızı bu özelliğe ayırdık ve diğer görevleri önceliklendirdik.
Avatar’ların mobilde popüler hale gelmesi sırasında teknoloji zaten web’de mevcuttu, hatta bir API ile birlikte. Ekibimizin yoğunlaşmış çabaları sayesinde, ilk çalışan sürümümüz App Store’da sadece beş günde hazırlandı ve highly rekabetçi avatar çıktı sundu. Bu, bizi Amerikan üst sıralamasında 2. sıraya taşıdı ve bizi bir hafta boyunca ABD’de en çok indirilen ikinci uygulama haline getirdi.
Ekibiniz yakın zamanda ARTA’nın AI avatar oluşturma özelliğine bir güncelleme yayınladı. Bu konuda bazı detaylar paylaşabilir misiniz?
AI modelleri, eğitim sırasında genel yüz özelliklerini ekler, bu da avatarların kaynak fotoğraflarından farklı görünmesine neden olur ve birinin özellikleri ne kadar benzersizse, AI yorumu o kadar farklı olabilir. Bu sorunu çözmek için kendi avatar hizmetimizi oluşturmaya karar verdik. Uzun bir süredir üçüncü taraf API kullandık, ancak önemli iyileştirmeler elde edemedik. Sunucu değişikliğiyle, kullanıcıların gerçek yüzünün benzerliğini avatar çıkışında daha iyi korumak için daha optimal eğitim teknolojisi kurabildik. Benzersiz boru hattımızın ayrıntılarını açıklamayabilirim, ancak bu, belirli bir SDXL ayarları, LORAs ve yüz geliştiricileri kombinasyonuna bağlı ve henüz başka yerde daha iyi sonuçlar görmedik.
Yeni sunucuyla, her avatar paketi için sabit bir maliyet yerine aylık sunucu ücretine geçtik ve şimdi avatarları ayrı in-app satın almalar yerine haftalık abonelik yoluyla sunabiliyoruz. Bu, kullanıcılarımız için daha tatmin edici bir deneyim yaratıyor ve eğer bir hafta içinde beş avatar paketi oluşturmak veya fotoğrafı değiştirmek isterlerse daha ucuz oluyor. Yukarıdakilerin tümü dikkate alındığında, avatar teklifimiz şu anda piyasadaki en iyi fiyat performans oranına sahip. Gerçekçi avatar oluşturabilen uygulamalar var, ancak ARTA, gerçekçi stillerle birlikte renkli ve parlak çıkış varyasyonları sunarak öne çıkıyor.
Ekibiniz uygulamanın yeteneklerini nasıl diğer şekillerde geliştirdi?
Genel kullanım durumları için, metin-görsel oluşturma, görsel dönüştürme ve inpainting için üçüncü taraf API’lerinin daha verimli olduğunu düşünüyoruz. Bu yaklaşım, bu işlevleri sunucu altyapımıza entegre etme zamanını ortadan kaldırır. Ayrıca, yeni bir özellik beklenenden daha az başarılı olduğunda ve onu kaldırmaya karar verdiğimizde maliyetleri azaltır. AI görsel oluşturma endüstrisi hızla gelişiyor ve birçok özel hizmet mevcut, bu nedenle hedeflerimize uyanları keşfediyor ve dần olarak benimseyiyoruz.
Aynı zamanda, ARTA’nın ihtiyaçları genellikle özelleştirilmiş iç hizmetlere ve kendi çözümlerimizin geliştirilmesine ihtiyaç duyuyor. Üçüncü taraf API’leri ya mevcut değil ya da tatmin edici bir çıktı kalitesi sunmuyor ise, özel hizmetlerimizi ve çözümlerimizi geliştiriyoruz. Örneğin, AI Avatar’ları güncellemenin yanı sıra, ML ve.prompt mühendislerimiz, uygulamanın AI Filtreleri (Selfies) özelliğine yeni bir boru hattı geliştirdiler. Ayrıca, AI Bebek özelliğimiz için benzersiz bir algoritma geliştirdik – iki kişinin fotoğraflarını birleştirmelerine ve nasıl görünebileceklerini görmelerine olanak tanıyan bir oluşturma işlevi. Ürün müdürü olarak dünyayı algılayışım, başlangıçta bunun başarısını sorguladım, ancak bu konsepti içeren reklam creatifleri çok popüler. Bu nedenle, pazarlama içgörülerini kontrol etmek, içerikle ilgili durumlarda özellikle faydalı oluyor.
Kullanıcılar ARTA’daki sanatsal süreci etkileyebilir mi? Eğer öyleyse, kullanıcıların AI tarafından üretilen sanat eserini özelleştirmek için hangi araçlar ve seçenekler mevcuttur?
Kullanıcıların karmaşık yönleri ile uğraşmasını istemiyoruz, bu nedenle kullanıcılarımızı basit bir sanatsal deneyim sunmaya çalışıyoruz. Kullanıcıların çıkışa etki edebileceği birincil yol, promtlardır. İşlemi şeffaf tutarak, model için gönderilecek tam sözleşme isteğini gösteriyoruz ve yalnızca etkili promtlar oluşturmaya ihtiyaç duyduklarında yardım sunuyoruz.
Her entegre model için en iyi varsayılan ayarları seçiyoruz, böylece kullanıcıların bunları maksimum sonuç için ayarlaması gerekmez, çünkü zaten optimal görsel üretim çıkışını sağlar. Yine de, kullanıcılar denemek isterse, gelişmiş mod bir tıklamayla uzakta ve bazı daha derin parametreler ayar bölümündedir.
Çok yakında, kullanıcıların aynı görseli yeniden oluştururken tam kontrolü sağlamak için Tohum parametresini ekleyeceğiz. Ayrıca,aspect oranları listesini genişletmeyi düşünüyoruz. Ayrıca, normal görsellerde de kontrol ağlarını sunmayı düşünüyoruz. Bunlar zaten sunucu tarafında destekleniyor, çünkü AI Filtreleri ve çizimleri oluşturmak için kullanıyoruz, ancak henüz son kullanıcılara teslim edilmedi.
AI gibi ARTA’nın geleneksel sanat pazarı üzerindeki etkisini nasıl görüyorsunuz? AI sanat oluşturmasını sanat endüstrisine bir bozulma olarak mı yoksa bir geliştirme olarak mı görüyorsunuz?
Bir geliştirme olarak görüyorum. Oluşturucu AI, sanatçıları, tasarımcıları, illüstratörleri ve diğer görsel içerik yaratıcılarını çeşitli görevlerde destekleyerek, fikirlerini keşfetmelerinden, kavramları geliştirmelerinden, eskizlere ve hazır görsellere kadar yardımcı olarak sanatçıların işini kolaylaştırmaya yardımcı oluyor. Sonunda, bu gelişmelerin avantajlarından yararlanabilmemiz, hayal gücümüzle sınırlı.
Örneğin, PC oyunları oluşturmayı severim ve yakın zamanda ARTA’yı oyunlar ve öğeler için simgeler oluşturmak için kullandım. Adobe Illustrator kullanarak kendim tasarlayabilirdim, ancak bir görsel oluşturucu ile hemen ihtiyacım olanı aldım. Eşim ise bir retoucher-photographer. Photoshop’un Oluşturucu Doldurma özelliği sayesinde daha hızlı çalışıyor ve daha fazla boş zamanı veya daha fazla retouching siparişi alabiliyor.
İyi yapıldığında, AI tarafından oluşturulan görseller profesyonel sanat eserlerinden ayırt edilemeyebilir. Ancak, bana göre, AI asla gerçek bir profesyoneli заменemez. Ne kadar yetenekli olurlarsa olsunlar, AI’lar insan tarafından oluşturulan verilere dayandıkları için, ürettiği her şey zaten bir yerlerde mevcut. Geçmişte ve şimdi,真正 yenilikçi fikirler ancak insanlar tarafından üretilebilir. AI sanatı, herkesi, sanatsal geçmişine bakılmaksızın, heyecan verici bir yeni deneyime davet eden beklenen bir spin-off gibi.
Görsel kalitesini geliştirmenin ötesinde, AI görsel oluşturmanın geleceğinin nereye gittiğini görüyorsunuz?
Görsel kalitesinin yanı sıra, görsel oluşturma hızı da artacak, bu da otomatik olarak daha maliyet efektif çıktılara yol açacak.
Sanırım, farklı ortamlarda ve pozisyonlarda aynı karakterleri oluşturmanın kolay bir yolu olmayacak. Bu nedenle, AI’ın comics, çocuk kitapları, oyun grafikleri ve daha fazlasında yükselişini göreceğiz. İç mimari ve reklam üretimi already aktif olarak AI’ı kullanıyor, ancak teknoloji devam ettiği sürece daha fazlası bizi bekliyor.
Tüm görsellerin güçlü GPU’lara ihtiyaç duyduğu düşünülürse, bu teknolojiler AI ile birlikte gelişmeye devam edecek. Sadece yolculuğun başındayız. Belki de yeni Apple, Nvidia olacak ve herkes, veya en azından BT endüstrisindeki herkes, yeni video kartı yayınlarını bekleyecek, tıpkı iPhone’lar için yaptığımız gibi.
AI görsel oluşturucular, yeni pop kültürden ortaya çıkan kavramları tanıtarak veya daha iyi teknoloji ile geliştirilen eski fikirleri canlandırarak eğlenceli ve çekici deneyimler sunmaya devam edecek. Örneğin, AI Bebek oluşturma ilgisi şu anda artıyor. Stable Diffusion tabanlı bir teknoloji, iki kişinin özelliklerini birleştirmenin ve biyolojik çocuklarının potansiyel görünümünü gösteren etkileyici bir çıktı sundu. Sonuçlar, birkaç yıl önce horoskop sitelerinde bulunanlardan çok daha iyi ve insanlar bunu yeniden denemek istiyor.
Oluşturucu AI’dan neler beklemeliyiz?
Video oluşturma popülerlik dalgası ufukta. Teknoloji yeterli seviyeye ulaştığında, insanların yüz ifadeleri ve jestlerini kullanarak video avatarlar oluşturmak için nöral ağları eğitmeye yönelik girişimler olacaktır, potansiyel olarak benzersiz kullanıcı sesleri ile birlikte.
AI Ses, müzik endüstrisi için yeni bir era getiren başka bir önemli ilerleme. Bu teknoloji, metin girişine dayalı şarkılar oluşturmak için harika fırsatlar sunuyor, bu da çeşitli video içerikleri için özel, stok olmayan soundtracks oluşturmak için mükemmel bir araç haline geliyor. Genel olarak, bir şeyin çok sıradan olduğunu rap veya romantik bir tonla söylemek gerçekten çok eğlenceli.
Harika bir röportaj için teşekkür ederiz. Daha fazla bilgi edinmek veya görseller oluşturmak isteyen okuyucular ARTA uygulamasını ziyaret edebilirler.












