Connect with us

Wawancara

Ernest Piatrovich, Product Manager di ARTA – Interview Series

mm

Ernest Piatrovich adalah Product Manager di AIBY Group, memimpin salah satu aplikasi AI-driven terkemuka perusahaan, ARTA – AI Image Generator untuk iPhone dan Android. Visi strategis dan pemikiran kreatifnya menghasilkan aplikasi tersebut mencapai posisi #2 di grafik teratas App Store AS tidak lama setelah dirilis, melintasi tonggak 15 juta unduhan di seluruh dunia, dan menawarkan AI Avatars dengan kinerja terbaik berdasarkan pipeline internal unik, di antara kesuksesan lainnya.

Anda telah bertanggung jawab untuk Mengelola ARTA – AI Art generator dari fase ideasi hingga sekarang. Bisakah Anda membagikan beberapa wawasan tentang hari-hari awal ini?

Tentu! Masa-masa itu dinamis. Kami berhasil merilis aplikasi yang sangat baik dalam waktu hanya satu minggu, menjadi salah satu pembuat aplikasi konsumen pertama yang menawarkan fungsionalitas text-to-image generation di mobile. Tujuan kami adalah membangun produk mass-market yang memberikan orang “seorang seniman” di kantong mereka. Jadi, sejak tahap konseptualisasi dan pengembangan awal, kami telah fokus pada kemudahan penggunaan dan skalabilitas. Namun, meskipun memasuki pasar dengan tepat waktu, itu cukup menantang untuk tumbuh volume instalasi kami hingga tingkat yang memadai, bahkan dengan tim media buying yang luar biasa seperti kami. Dorongan signifikan terjadi tiga bulan setelah rilis aplikasi ketika fitur Avatar kami menjadi hype. Volume itu dengan cepat menjadi moderat tinggi untuk niche kami, dan sejak itu, tugas kami adalah mempertahankan dan meningkatkannya.

Apa yang menjadi tech stack asli yang Anda luncurkan dan apa saja tantangan dengan art generation selama periode ini?

Kami meluncurkan berdasarkan Stable Diffusion 1.3 menggunakan API resmi dari Stability.ai. Saya harus mengatakan bahwa situasi dengan kualitas generasi saat itu dan sekarang seperti siang dan malam. Ketika kami pertama kali memulai, manajer QA kami sering melaporkan masalah terkait dengan nilai estetika gambar atau ketidakakuratan dalam merepresentasikan konsep dan fitur tertentu. Namun, itu adalah standar untuk Stable Diffusion pada saat itu. Sekarang, output generasi jauh lebih baik dalam semua aspek, termasuk reproduksi gaya, koherensi komposisi, fidelitas visual, tingkat detail, dan lain-lain.

Tidak lama setelah rilis aplikasi, kami mulai menyewa server di Amazon, dan mendukungnya ternyata cukup menantang. Bahkan dengan dana yang cukup, mungkin tidak ada A100 yang tersedia saat Anda membutuhkannya, dan Anda harus menunggu beberapa hari. Dengan demikian, kami harus hidup tanpa autoscale, mengalihkan semua lalu lintas berlebih ke API mitra kami.

Mempertahankan semua ini tetap cukup sulit hingga hari ini, dengan masalah kecil yang terjadi pada satu ujung atau lainnya setiap bulan atau lebih. Misalnya, kami terkadang mengalami masalah sementara dengan kualitas generasi ketika penyedia memperbarui server, menguji bobot, atau menerapkan perubahan lain yang mempengaruhi output generasi. Kesalahan seperti itu dapat berlangsung dari satu jam hingga setengah hari dan tidak dapat diprediksi serta sulit dilacak. Biasanya, saat departemen dukungan kami menerima laporan pengguna tentang gambar yang buram atau masalah lain yang terjadi, penyedia API sudah memperbaiki masalahnya. Namun, itu adalah kekhawatiran serius bagi pengguna kami. Oleh karena itu, kami sekarang membangun sistem yang menggabungkan beberapa penyedia dan server kami sendiri untuk generasi khusus, memungkinkan kami memiliki lebih banyak kontrol di sisi kami.

Sebagai product manager, keputusan strategis apa yang telah menjadi kunci dalam memandu ARTA ke posisi peringkat teratas tidak lama setelah rilisnya?

Pertumbuhan awal ARTA (saat itu disebut Aiby) merupakan hasil dari keputusan tepat waktu untuk mengimplementasikan fitur Avatar viral ketika itu baru saja mulai membuat gelombang di media sosial. Kami dengan cepat mengenali minat yang tumbuh terhadap fungsionalitas ini. Seluruh tim, termasuk produk, pemasaran, dan pengembangan, berada di gelombang yang sama dan memiliki visi tentang kesuksesannya. Kami juga mengakui bahwa waktu ke pasar yang singkat sangat penting. Jadi, dari hari pertama, kami mendedikasikan semua sumber daya kami untuk mewujudkan fitur ini, mengutamakannya di atas tugas lain.

Karena deadline kami adalah ASAP agar tidak melewatkan momen ketika AI Avatars mencapai puncak hype-nya, kami memilih untuk menggunakan solusi pihak ketiga dan menyesuaikannya untuk aplikasi kami. Sementara avatar mulai mendapatkan popularitas di mobile, teknologi tersebut sudah tersedia di web selama beberapa waktu, bahkan dengan API. Berkat upaya tim yang terfokus, versi kerja pertama kami ada di App Store dalam waktu hanya lima hari, menawarkan output avatar yang sangat kompetitif. Itu membantu kami mencapai posisi #2 di grafik teratas Amerika dan tetap menjadi aplikasi yang paling banyak diunduh kedua di AS selama seminggu.

Tim Anda baru-baru ini merilis pembaruan untuk fitur generasi avatar AI ARTA. Bisakah Anda membagikan beberapa detail tentang hal ini?

Model AI cenderung menambahkan fitur wajah generik selama pelatihan, membuat avatar terlihat berbeda dari foto sumber, dan semakin unik ciri seseorang, semakin tidak mirip interpretasi AI dapat terlihat. Untuk mengatasi masalah ini, kami memutuskan untuk membuat layanan avatar kami sendiri. Kami telah menggunakan API pihak ketiga selama waktu yang lama tetapi tidak menghasilkan perbaikan yang signifikan. Dengan pergeseran server, kami dapat mengatur teknologi pelatihan yang lebih optimal untuk mempertahankan kesamaan wajah pengguna yang sebenarnya dalam output avatar. Meskipun saya tidak dapat mengungkapkan pipeline unik kami secara rinci, itu menjadi mungkin berkat kombinasi tertentu dari pengaturan SDXL, LORAs, dan face enhancers, dan kami belum melihat hasil yang lebih baik di tempat lain.

Dengan server baru, kami beralih dari biaya tetap untuk setiap paket avatar ke biaya server bulanan dan sekarang dapat menawarkan avatar melalui langganan mingguan sebagai gantinya memerlukan pembelian dalam aplikasi yang terpisah. Ini menciptakan pengalaman yang lebih memuaskan dan jauh lebih murah bagi pengguna kami jika mereka ingin menghasilkan, misalnya, lima paket avatar dalam seminggu atau mengubah input foto saat mereka melakukannya. Mengingat semua hal di atas, penawaran avatar kami saat ini memiliki rasio harga-kinerja terbaik di pasar. Sementara ada aplikasi yang dapat membuat avatar realistis yang berkualitas tinggi, ARTA menonjol dengan menawarkan berbagai variasi output yang cerah dan berwarna-warni selain gaya realistis, semuanya dengan tingkat pengenalan wajah yang sama akurat.

Bagaimana cara lain tim telah memperbaiki kemampuan aplikasi?

Kami menyimpulkan bahwa menggunakan API pihak ketiga lebih efisien untuk kasus penggunaan umum seperti text-to-image generation, konversi gambar, dan inpainting. Pendekatan ini menghilangkan kebutuhan untuk menghabiskan waktu untuk memahami bagaimana mengintegrasikan fungsionalitas ini ke infrastruktur server kami. Selain itu, itu mengurangi biaya dalam situasi di mana fitur baru tidak berfungsi sebagaimana diharapkan dan kami memutuskan untuk menghapusnya. Industri generasi gambar AI berkembang pesat, dengan banyak layanan khusus yang tersedia, jadi kami menjelajahi dan secara bertahap mengadopsi layanan yang sesuai dengan tujuan kami.

Pada saat yang sama, kebutuhan ARTA sering kali terbukti cukup unik, memerlukan temuan internal. Dalam kasus di mana API yang disesuaikan tidak ada atau tidak memberikan kualitas output yang memuaskan, kami mengkhususkan dan menyesuaikan layanan internal kami dan mengembangkan solusi kami sendiri untuk mencapai hasil yang kami inginkan. Misalnya, selain meningkatkan AI Avatars, insinyur ML dan prompt kami telah menghasilkan pipeline baru untuk fitur AI Filters (Selfies) aplikasi. Kami juga telah mengembangkan algoritma unik untuk fitur AI Baby kami yang akan datang – sebuah fungsionalitas penggenerasan yang memungkinkan dua orang untuk menggabungkan foto mereka dan melihat bagaimana anak mereka mungkin terlihat. Berdasarkan persepsi saya tentang dunia sebagai product manager, saya awalnya meragukan kesuksesannya, tetapi iklan kreatif yang menampilkan konsep ini sangat populer. Jadi, memeriksa wawasan pemasaran sangat membantu dalam kasus terkait konten.

Pengguna dapat mempengaruhi proses artistik di ARTA? Jika ya, apa saja alat dan opsi yang tersedia bagi pengguna untuk menyesuaikan karya seni yang dihasilkan AI?

Kami menangani semua aspek kompleks yang terkait dengan generasi, dengan tujuan memberikan pengguna kami pengalaman artistik yang sederhana tanpa kelebihan beban teknis yang tidak perlu. Jadi, cara utama pengguna mempengaruhi output adalah melalui prompt. Kami menjaga proses ini transparan dengan menampilkan permintaan kata yang tepat yang akan dikirim ke model untuk generasi dan hanya menawarkan bantuan dengan mengkomposisi prompt yang efektif jika diperlukan.

Kami memilih pengaturan default terbaik untuk setiap model yang terintegrasi sehingga pengguna tidak perlu memusingkan hal itu. Biasanya, tidak ada kebutuhan untuk menyesuaikan pengaturan untuk memaksimalkan hasil, karena mereka sudah menghasilkan output generasi yang optimal. Namun, jika pengguna ingin bereksperimen, mode lanjutan hanya satu ketukan jauhnya, dan beberapa parameter yang lebih dalam ada di bagian pengaturan.

Tidak lama lagi, kami akan menambahkan parameter Seed, yang memungkinkan pengguna memiliki kontrol penuh atas generasi ketika mereka perlu menghasilkan gambar yang identik dari awal. Selain itu, kami berencana untuk memperluas daftar rasio aspek. Kami juga berpikir untuk menambahkan beberapa controlnet ke generasi reguler. Mereka sudah didukung di sisi server, karena kami menggunakannya untuk menghasilkan AI Filters dan sketsa, tetapi mereka belum disampaikan kepada pengguna akhir.

Bagaimana Anda memandang dampak AI seperti ARTA pada pasar seni tradisional? Apakah Anda melihat generasi AI sebagai gangguan atau peningkatan pada industri seni?

Saya melihatnya sebagai peningkatan. AI generatif telah memperkenalkan peluang baru dan berharga untuk meningkatkan proses artistik sambil secara signifikan mengurangi waktu putar. Ini membantu seniman digital, desainer, ilustrator, dan pembuat konten visual lainnya dengan berbagai tugas, dari mengembangkan ide dan mengembangkan konsep hingga menghasilkan sketsa dan gambar yang siap digunakan. Pada akhirnya, kemampuan kami untuk memanfaatkan kemajuan ini hanya terbatas oleh imajinasi kami.

Misalnya, saya memiliki hobi membuat game PC, dan baru-baru ini, saya menggunakan ARTA untuk menghasilkan serangkaian ikon untuk keterampilan dan item. Saya bisa merancangnya sendiri menggunakan Adobe Illustrator, tetapi dengan generator gambar, saya mendapatkan apa yang saya butuhkan hampir seketika. Istri saya, di sisi lain, adalah retoucher-photographer. Berkat Generative Fill dari Photoshop, dia bekerja jauh lebih cepat dan memiliki lebih banyak waktu luang (atau lebih banyak pendapatan jika dia memutuskan untuk menerima lebih banyak pesanan retouching).

Ketika dilakukan dengan baik, gambar yang dihasilkan AI dapat terlihat tidak dapat dibedakan dari karya seni profesional. Namun, menurut pendapat saya, AI tidak akan pernah menggantikan seorang profesional sejati. Tidak peduli seberapa terampil jaringan neural menjadi, mereka masih dilatih pada data yang dibuat oleh manusia, yang berarti bahwa semua yang mereka hasilkan sudah ada di suatu tempat. Baik saat itu dan sekarang, ide-ide yang benar-benar inovatif hanya dapat dihasilkan oleh manusia. Sementara makna tradisional seni tetap terkait dengan karya yang dibuat oleh manusia, seni AI seperti spinoff yang diantisipasi, mengundang semua orang, terlepas dari latar belakang artistik, untuk mencoba pengalaman baru yang menarik.

Melihat melampaui hanya meningkatkan kualitas gambar, ke mana Anda melihat masa depan generasi gambar AI menuju?

Bersamaan dengan kualitas gambar, kecepatan generasi akan meningkat, yang secara otomatis akan mengarah pada output yang lebih efektif biaya.

Saya pikir tidak lama lagi akan ada cara mudah untuk menghasilkan karakter yang sama dalam lingkungan dan posisi yang berbeda sehingga kita akan melihat munculnya AI dalam komik, buku anak-anak, grafik game, dan lain-lain. Desain interior dan produksi kreatif iklan sudah merupakan bidang yang secara aktif memanfaatkan AI generatif, tetapi lebih banyak lagi yang akan datang ketika teknologi ini terus berkembang.

Mengingat bahwa semua generasi memerlukan GPU yang kuat, teknologi ini akan berkembang seiring dengan AI selama waktu yang cukup lama. Kami hanya berada di awal perjalanan. Mungkin Apple baru dari zaman kita akan menjadi Nvidia, dengan semua orang, atau setidaknya mereka yang di industri IT, sangat menantikan rilis kartu video baru seperti yang kita lakukan dengan iPhone.

Penghasil gambar AI akan terus menyajikan pengalaman yang menyenangkan dan menarik, baik dengan memperkenalkan konsep baru yang muncul dari budaya pop atau menghidupkan kembali ide-ide lama dengan teknologi yang lebih baik. Misalnya, minat pada generasi AI Baby saat ini tumbuh. Salah satu teknologi terbaru berdasarkan Stable Diffusion telah menunjukkan output yang mengesankan dari menggabungkan fitur dua individu untuk mengungkapkan penampilan potensial anak biologis mereka. Hasilnya jauh melampaui apa yang tersedia di situs horoskop beberapa tahun yang lalu, dan orang-orang sangat ingin mencobanya lagi.

Apa yang menjadi prediksi Anda tentang apa yang harus kita harapkan selanjutnya dari AI Generatif?

Gelombang popularitas untuk generasi video ada di cakrawala. Dengan kemajuan teknologi mencapai tingkat yang memadai, pasti akan ada upaya untuk melatih jaringan neural menggunakan ekspresi wajah dan gerakan orang untuk membuat avatar video, potensi bahkan dengan suara unik pengguna.

AI Audio adalah kemajuan signifikan lainnya yang membuka era baru untuk industri produksi musik. Teknologi ini sudah memperkenalkan peluang luar biasa untuk menggubah lagu berdasarkan input teks, membuatnya menjadi alat yang sangat baik untuk membuat soundtrack kustom untuk berbagai jenis konten video. Secara keseluruhan, sangat menyenangkan untuk mendengar sesuatu yang sepele seperti Syarat dan Ketentuan yang dinyanyikan atau dinyanyikan dengan intonasi romantis.

Terima kasih atas wawancara yang luar biasa, pembaca yang ingin mempelajari lebih lanjut atau menghasilkan beberapa gambar harus mengunjungi ARTA.

Antoine adalah seorang pemimpin visioner dan mitra pendiri Unite.AI, didorong oleh semangat yang tak tergoyahkan untuk membentuk dan mempromosikan masa depan AI dan robotika. Seorang wirausaha serial, ia percaya bahwa AI akan sama-sama mengganggu masyarakat seperti listrik, dan sering tertangkap berbicara tentang potensi teknologi mengganggu dan AGI.

As a futurist, ia berdedikasi untuk mengeksplorasi bagaimana inovasi ini akan membentuk dunia kita. Selain itu, ia adalah pendiri Securities.io, sebuah platform yang fokus pada investasi di teknologi-teknologi canggih yang mendefinisikan kembali masa depan dan membentuk kembali seluruh sektor.