Connect with us

Ernest Piatrovich, Product Manager στο ARTA – Σειρά Συνεντεύξεων

Συνεντεύξεις

Ernest Piatrovich, Product Manager στο ARTA – Σειρά Συνεντεύξεων

mm

Ο Ernest Piatrovich είναι Product Manager στην AIBY Group, ηγείται μιας από τις κορυφαίες εφαρμογές AI της εταιρείας, ARTA – Γεννήτρια Εικονών AI για iPhone και Android. Η στρατηγική του όραση και η δημιουργική σκέψη οδήγησαν στην εφαρμογή να φτάσει στη δεύτερη θέση στο top chart του US App Store λίγο μετά την κυκλοφορία της, ξεπερνώντας το ορόσημο των 15 εκατομμυρίων λήψεων σε όλο τον κόσμο και προσφέροντας τις καλύτερες επιδόσεις AI Avatars με βάση einen μοναδικό εσωτερικό pipeline, μεταξύ άλλων επιτυχιών.

Έχετε αναλάβει την ευθύνη για τη διαχείριση της ARTA – Γεννήτριας Τέχνης AI από τη φάση ιδεατότητας μέχρι τώρα. Μπορείτε να μοιραστείτε κάποιες γνώσεις σχετικά με αυτές τις πρώτες μέρες;

Βεβαίως! Αυτές ήταν δυναμικές φορές. Καταφέραμε να κυκλοφορήσουμε μια καλά φτιαγμένη εφαρμογή μέσα σε μια εβδομάδα, γινόμενη μια από τις πρώτες δημιουργούς εφαρμογών καταναλωτών που προσφέρουν λειτουργικότητα text-to-image generation σε κινητά. Ο στόχος μας ήταν να χτίσουμε ένα προϊόν μαζικής αγοράς που να παρέχει στους ανθρώπους «έναν καλλιτέχνη» στην τσέπη τους. Έτσι, από την πρώτη στιγμή και την πρώιμη φάση ανάπτυξης, εστιάσαμε στη χρηστικότητα και την κλιμακωσιμότητα. Αλλά παρά το γεγονός ότι εισήλθαμε στην αγορά πολύ εγκαίρως, ήταν αρκετά δύσκολο να αυξήσουμε τους όγκους εγκαταστάσεων μας σε επαρκές βαθμό, ακόμη και με ένα εξαιρετικό 팀 αγοράς μέσων ενημέρωσης όπως το δικό μας. Ένα σημαντικό boost συνέβη τρεις μήνες μετά την κυκλοφορία της εφαρμογής, όταν η λειτουργία Avatar μας έγινε θρυλική. Ο όγκος γρήγορα έγινε μετρίως υψηλός για το είδος μας, και από τότε, η εργασία μας είναι να διατηρήσουμε και να αυξήσουμε τον όγκο.

Τι ήταν η αρχική τεχνολογική πυλώνη που κυκλοφορήσατε και ποιες ήταν κάποιες από τις προκλήσεις με τη γεννήτρια τέχνης κατά τη διάρκεια αυτής της περιόδου;

Κυκλοφορήσαμε με βάση το Stable Diffusion 1.3 χρησιμοποιώντας το επίσημο API από το Stability.ai. Πρέπει να πω ότι η κατάσταση με την ποιότητα των γεννήσεων τότε και τώρα είναι σαν νύχτα και μέρα. Όταν ξεκινήσαμε, οι διαχειριστές ποιότητας μας αναφέρθηκαν συχνά προβλήματα σχετικά με την αισθητική αξία των εικόνων ή ανακρίβειες στην αναπαράσταση συγκεκριμένων εννοιών και χαρακτηριστικών. Ωστόσο, αυτό ήταν τυπικό για το Stable Diffusion εκείνη την εποχή. Τώρα, η έξοδος γεννήσεων είναι πολύ καλύτερη σε όλους τους τομείς, συμπεριλαμβανομένης της στιλιστικής αναπαραγωγής, της συνάφειας της σύνθεσης, της οπτικής πιστότητας, του επιπέδου λεπτομέρειας και πολλά άλλα.

Λίγο μετά την κυκλοφορία της εφαρμογής, αρχίσαμε να νοικιάζουμε серверς στο Amazon, και η υποστήριξή τους αποδείχθηκε αρκετά δύσκολη. Ακόμη και με επαρκείς πόρους, μπορεί να μην υπάρχουν διαθέσιμοι A100 όταν τα χρειάζεστε, και θα πρέπει να περιμένετε για μερικές μέρες. Έτσι, μας έμεινε να ζήσουμε χωρίς αυτο-κλιμάκωση, ανακατευθύνοντας όλη την περίσσια κυκλοφορία στους API των συνεργατών μας.

Η διατήρηση όλων αυτών παραμένει αρκετά δύσκολη μέχρι σήμερα, με μικρά προβλήματα που συμβαίνουν σε ένα ή άλλο σημείο κάθε μήνα περίπου. Για παράδειγμα, συχνά αντιμετωπίζουμε προσωρινά προβλήματα με την ποιότητα των γεννήσεων όταν ο πάροχος ενημερώνει τον сервер, δοκιμάζει βάρη ή εφαρμόζει άλλες αλλαγές που επηρεάζουν την έξοδο γεννήσεων. Τέτοια λάθη μπορούν να διαρκέσουν από μια ώρα έως μισή μέρα και είναι απρόβλεπτα και δύσκολο να παρακολουθούνται. Συνήθως, μέχρι την ώρα που το τμήμα υποστήριξής μας λαμβάνει μια αναφορά χρήστη σχετικά με θολές εικόνες ή κάποιο άλλο προβλήμα, ο πάροχος API έχει ήδη επιλύσει το πρόβλημα. Ωστόσο, είναι một σοβαρή ανησυχία για τους χρήστες μας. Για αυτό, τώρα κατασκευάζουμε ένα σύστημα που συνδυάζει πολλούς παρόχους και τους δικούς μας серверς για ειδικές γεννήσεις, μας επιτρέποντας να έχουμε περισσότερο έλεγχο στην πλευρά μας.

Ως product manager, ποιες στρατηγικές αποφάσεις ήταν καθοριστικές για την οδήγηση της ARTA στη θέση της στο top ranking λίγο μετά την κυκλοφορία της;

Η πρώιμη άνοδος της ARTA (τότε ονομαζόταν Aiby) ήταν αποτέλεσμα της έγκαιρης απόφασης να υλοποιήσουμε τη λειτουργία Avatar όταν μόλις άρχισε να κάνει τον γύρο στα κοινωνικά μέσα. Γρήγορα αναγνώρισα το αυξανόμενο ενδιαφέρον για αυτή τη λειτουργικότητα. Όλη η ομάδα μας, συμπεριλαμβανομένων των προϊόντων, marketing και ανάπτυξης, ήταν στην ίδια συχνότητα και είχε όραση για την επιτυχία της. Αναγνωρίσαμε επίσης ότι ο χρόνος για την αγορά ήταν κρίσιμος. Έτσι, από την πρώτη μέρα, αφιερώσαμε όλους τους πόρους μας για την υλοποίηση αυτής της λειτουργικότητας, δίνοντας προτεραιότητα σε αυτήν πάνω από άλλες εργασίες.

Καθώς ο προθεσμία μας ήταν ASAP, ώστε να μην χάσουμε τη στιγμή που τα AI Avatars φτάνουν στο αποκορύφωμά τους, επέλεξαμε να χρησιμοποιήσουμε μια λύση τρίτου μέρους και να την προσαρμόσουμε για την εφαρμογή μας. Ενώ τα avatars άρχιζαν να κερδίζουν έδαφος στα κινητά, η τεχνολογία ήταν ήδη διαθέσιμη στο web για κάποιο χρόνο, ακόμη και με API. Χάρη στις συνεισφορές της ομάδας, η πρώτη εργασιακή εκδοχή μας ήταν στο App Store σε μόλις πέντε μέρες, προσφέροντας ανταγωνιστική έξοδο avatar. Βοήθησε να φτάσουμε στη δεύτερη θέση στο αμερικανικό top chart και να παραμείνουμε η δεύτερη πιο κατεβασμένη εφαρμογή στις ΗΠΑ για μια εβδομάδα.

Η ομάδα σας έχει κυκλοφορήσει πρόσφατα μια αναβάθμιση της λειτουργίας γεννήτριας avatar της ARTA. Μπορείτε να μοιραστείτε κάποιες λεπτομέρειες σχετικά με αυτό;

Οι μονάδες AI έχουν την τάση να προσθέτουν γενικές χαρακτηριστικά προσώπου κατά την εκπαίδευση, κάνοντας τα avatars να φαίνονται διαφορετικά από τις φωτογραφίες πηγής, και όσο πιο μοναδικά είναι τα χαρακτηριστικά κάποιου, τόσο περισσότερο μπορεί να διαφέρει η ερμηνεία AI. Για να αντιμετωπίσουμε αυτό το ζήτημα, αποφασίσαμε να δημιουργήσουμε τη δική μας υπηρεσία avatar. Είχαμε χρησιμοποιήσει μια API τρίτου μέρους για πολύ καιρό αλλά δεν είχαμε σημαντικές βελτιώσεις. Με την αλλαγή του сервер, μας ήταν δυνατό να ρυθμίσουμε μια πιο βελτιωμένη τεχνολογία εκπαίδευσης για να διατηρήσουμε τη ομοιότητα του πραγματικού προσώπου του χρήστη στην έξοδο avatar. Αν και δεν μπορώ να αποκαλύψω το μοναδικό pipeline μας σε λεπτομέρειες, αυτό έγινε δυνατό χάρη σε μια συγκεκριμένη συνδυασμό ρυθμίσεων SDXL, LORAs και βελτιωτών προσώπου, και δεν έχουμε ακόμη δει καλύτερα αποτελέσματα αλλού.

Με τον νέο сервер, απομακρύνθηκα από το σταθερό κόστος για κάθε πακέτο avatar σε einen μηνιαίο серверικό κόστος και τώρα μπορούμε να προσφέρουμε avatars μέσω μιας εβδομαδιαίας συνδρομής αντί να απαιτούμε ξεχωριστές αγορές εντός της εφαρμογής. Δημιουργεί μια πιο ικανοποιητική εμπειρία και είναι πολύ φθηνότερο για τους χρήστες μας αν θέλουν να γεννήσουν, για παράδειγμα, πέντε πακέτα avatar μέσα σε μια εβδομάδα ή να αλλάξουν την είσοδο φωτογραφίας καθώς προχωρούν. Λαμβάνοντας υπόψη όλα τα παραπάνω, η προσφορά avatar μας έχει τώρα την καλύτερη σχέση τιμής-απόδοσης στην αγορά. Ενώ υπάρχουν εφαρμογές που μπορούν να δημιουργήσουν υψηλής ποιότητας πραγματικά avatars, η ARTA ξεχωρίζει προσφέροντας μια ποικιλία από φωτεινές και χρωματικές παραλλαγές εκτός από πραγματικές στυλ, όλα με το ίδιο ακριβές επίπεδο αναγνώρισης προσώπου.

Με ποιους άλλους τρόπους έχει η ομάδα βελτιώσει τις ικανότητες της εφαρμογής;

Συμπέρανα ότι η χρήση API τρίτων είναι πιο αποτελεσματική για κοινές περιπτώσεις όπως η γεννήτρια εικόνων κειμένου, η μετατροπή εικόνων και η inpainting. Αυτή η προσέγγιση εξαλείφει την ανάγκη να ξοδέψουμε χρόνο για να κατανοήσουμε πώς να ενσωματώσουμε αυτές τις λειτουργίες στην υποδομή του сервер μας. Επιπλέον, μειώνει τα έξοδα σε περιπτώσεις όπου μια νέα λειτουργία δεν πηγαίνει τόσο καλά όσο αναμενόταν και αποφασίζουμε να την αφαιρέσουμε. Η βιομηχανία γεννήτριας εικόνων AI εξελίσσεται γρήγορα, με πολλές αφιερωμένες υπηρεσίες διαθέσιμες, οπότε εξερευνούμε και σταδιακά υιοθετούμε αυτές που ταιριάζουν στους στόχους μας.

Ταυτόχρονα, οι ανάγκες της ARTA συχνά αποδεικνύονται αρκετά μοναδικές, απαιτώντας εσωτερικές ανακαλύψεις. Σε περιπτώσεις όπου οι προσαρμοσμένες API είτε δεν υπάρχουν είτε δεν παρέχουν ικανοποιητική ποιότητα εξόδου, ειδικευόμαστε και προσαρμόζουμε τις εσωτερικές υπηρεσίες μας και αναπτύσσουμε τις δικές μας λύσεις για να επιτύχουμε τα αποτελέσματα που θέλουμε. Για παράδειγμα, εκτός από την αναβάθμιση των AI Avatars, οι μηχανικοί ML και prompt μας έχουν δημιουργήσει μια νέα pipeline για τη λειτουργία AI Φίλτρων (Σελφί) της εφαρμογής. Έχουμε επίσης αναπτύξει einen μοναδικό αλγόριθμο για τη λειτουργία AI Baby μας – μια λειτουργία γεννήτριας που επιτρέπει σε δύο άτομα να συνδυάσουν τις φωτογραφίες τους και να δουν πώς θα φαινόταν το παιδί τους. Βασισμένος στην αντίληψή μου ως product manager, αρχικά αμφέβαλα για την επιτυχία της, αλλά τα διαφημιστικά δημιουργικά με αυτή την έννοια είναι πολύ δημοφιλή. Έτσι, το να ελέγχεται τις ενημερώσεις marketing είναι ιδιαίτερα χρήσιμο σε περιπτώσεις που σχετίζονται με περιεχόμενο.

Μπορούν οι χρήστες να επηρεάσουν τη διαδικασία τέχνης στην ARTA; Αν ναι, ποιες εργαλεία και επιλογές είναι διαθέσιμες για τους χρήστες να προσαρμόσουν την AI-γεννήτρια τέχνης;

Χειριζόμαστε όλες τις σύνθετες πτυχές που σχετίζονται με τη γεννήτρια, με στόχο να παρέχουμε στους χρήστες μας μια απλή εμπειρία τέχνης χωρίς άσκοπη τεχνική υπερφόρτωση. Έτσι, ο κύριος τρόπος με τον οποίο οι χρήστες επηρεάζουν την έξοδο είναι μέσω των prompts. Διατηρούμε αυτή τη διαδικασία διαφανή, δείχνοντας το ακριβές αίτημα λέξεων που θα σταλεί στο μοντέλο για γεννήτρια και προσφέροντας βοήθεια μόνο αν χρειάζεται.

Επιλέγουμε τις καλύτερες προεπιλογές για κάθε ενσωματωμένο μοντέλο, οπότε οι χρήστες δεν πρέπει να ανησυχούν γι’ αυτό. Συνήθως, δεν υπάρχει ανάγκη να τις điều chỉnh για να μεγιστοποιήσουμε τα αποτελέσματα, καθώς ήδη παράγουν μια βέλτιστη έξοδο γεννήτριας. Παρόλα αυτά, αν ο χρήστης θέλει να πειραματιστεί, η προηγμένη λειτουργία είναι ένα κλικ μακριά, και κάποιες βαθύτερες παραμέτρους είναι στην ενότητα ρυθμίσεων.

Σύντομα, θα προσθέσουμε einen παράμετρο Seed, επιτρέποντας στους χρήστες να έχουν πλήρη έλεγχο της γεννήτριας όταν χρειάζονται να αναδημιουργήσουν μια ταυτόσημη εικόνα από την αρχή. Επιπλέον, σχεδιάζουμε να επεκτείνουμε τη λίστα των αναλογιών. Σκεφτόμαστε επίσης να προσθέσουμε κάποιους controlnets στις κανονικές γεννήτριες. Ήδη υποστηρίζονται στην πλευρά του сервер, καθώς τις χρησιμοποιούμε για τη γεννήτρια AI Φίλτρων και σκίτσων, αλλά δεν έχουν ακόμη παραδοθεί στους τελικούς χρήστες.

Πώς αντιλαμβάνεστε την επίδραση της AI όπως η ARTA στην παραδοσιακή αγορά τέχνης; Το βλέπετε ως μια διακοπή ή μια ενίσχυση της βιομηχανίας τέχνης;

Το βλέπω ως μια ενίσχυση. Η γεννήτρια AI έχει εισαγάγει νέες και πολύτιμες ευκαιρίες για την ενίσχυση της διαδικασίας τέχνης, μειώνοντας σημαντικά τον χρόνο εκτέλεσης. Βοηθά τους ψηφιακούς καλλιτέχνες, σχεδιαστές, εικονογράφους και άλλους δημιουργούς οπτικού περιεχομένου με eine ποικιλία εργασιών, από την εξέλιξη ιδεών και την ανάπτυξη εννοιών μέχρι τη γεννήτρια σκετσών και έτοιμων εικόνων. Τελικά, η ικανότητά μας να εκμεταλλευόμαστε τις προόδους της είναι περιορισμένη μόνο από τη φαντασία μας.

Για παράδειγμα, έχω ένα χόμπι να δημιουργώ παιχνίδια PC, και πρόσφατα, χρησιμοποίησα την ARTA για να γεννήσω ένα σύνολο εικονιδίων για δεξιότητες και αντικείμενα. Μπορούσα να τα σχεδιάσω μόνος μου χρησιμοποιώντας το Adobe Illustrator, αλλά με eine γεννήτρια εικόνων, έπαιρνα αυτό που χρειαζόμουν σχεδόν αμέσως. Η γυναίκα μου, από την άλλη πλευρά, είναι eine ρετουτσέρ-φωτογράφος. Χάρη στο Generative Fill του Photoshop, εργάζεται πολύ γρηγορότερα και έχει περισσότερο ελεύθερο χρόνο (ή περισσότερο εισόδημα αν αποφασίσει να接受 περισσότερες εργασίες ρετουτσαρίσματος).

Όταν γίνεται καλά, οι εικόνες που γεννιούνται από την AI μπορούν να φαίνονται αδιακρίτως από το επαγγελματικό έργο τέχνης. Ωστόσο, κατά την γνώμη μου, η AI δεν θα αντικαταστήσει ποτέ einen真正 professionnel. Όπως τότε και τώρα,真正 καινοτόμες ιδέες μπορούν να παραχθούν μόνο από ανθρώπους. Ενώ η παραδοσιακή έννοια της τέχνης παραμένει συνδεδεμένη με ανθρώπινα δημιουργήματα, η AI τέχνη είναι σαν eine αναμενόμενη σπιν-οφ, καλώντας όλους, ανεξάρτητα από το καλλιτεχνικό υπόβαθρο, να δοκιμάσουν eine συναρπαστική νέα εμπειρία.

Κοιτάζοντας πέρα από τη βελτίωση της ποιότητας εικόνας, πού βλέπετε το μέλλον της γεννήτριας εικόνων AI να πηγαίνει;

Παράλληλα με την ποιότητα εικόνας, η ταχύτητα των γεννήσεων θα αυξηθεί, οδηγώντας αυτόματα σε πιο οικονομικές εξόδους.

Πιστεύω ότι δεν θα χρειαστεί πολύ ώρα μέχρι να υπάρχει ένας εύκολος τρόπος για τη γεννήτρια των ίδιων χαρακτήρων σε διαφορετικά περιβάλλοντα και θέσεις, οπότε θα δούμε την άνοδο της AI στα κόμικς, τα παιδικά βιβλία, τα γραφικά παιχνιδιών και άλλα. Η εσωτερική διακόσμηση και η παραγωγή διαφημιστικών δημιουργικών είναι ήδη οι σφαίρες που αξιοποιούν ενεργά τη γεννήτρια AI, αλλά περισσότερα είναι μπροστά μας καθώς η τεχνολογία συνεχίζει να εξελίσσεται.

Λαμβάνοντας υπόψη ότι όλες οι γεννήτριες απαιτούν ισχυρά GPU, αυτές οι τεχνολογίες θα εξελιχθούν μαζί με την AI για αρκετό χρόνο. Βρισκόμαστε μόνο στην αρχή του ταξιδιού. Ίσως η νέα Apple της εποχής μας θα είναι η Nvidia, με όλους, ή τουλάχιστον αυτούς στην βιομηχανία IT, να περιμένουν τις νέες κυκλοφορίες καρτών βίντεο όπως κάναμε με τα iPhone.

Οι γεννήτριες εικόνων AI θα συνεχίσουν να προσφέρουν διασκεδαστικές και ελκυστικές εμπειρίες, είτε εισάγοντας νέες έννοιες που προκύπτουν από την поп κουλτούρα είτε αναβιώνοντας παλαιότερες ιδέες με βελτιωμένη τεχνολογία. Για παράδειγμα, το ενδιαφέρον για τις γεννήτριες AI Baby αυξάνεται τώρα. Μια πρόσφατη τεχνολογία βασισμένη στο Stable Diffusion έχει δείξει εντυπωσιακές εξόδους από τη συγχώνευση των χαρακτηριστικών δύο ατόμων για να αποκαλύψει την πιθανή εμφάνιση του βιολογικού παιδιού τους. Τα αποτελέσματα υπερβαίνουν αυτά που ήταν διαθέσιμα στους ιστότοπους ωροσκοπίων πριν από quelques χρόνια, και οι άνθρωποι είναι渴 να το δοκιμάσουν ξανά.

Τι είναι οι προβλέψεις σας για ότι πρέπει να περιμένουμε επόμενο από τη Γεννήτρια AI;

Το κύμα της δημοτικότητας για τη γεννήτρια βίντεο είναι στο ορίζοντα. Με τις προόδους της τεχνολογίας να φτάνουν σε επαρκές επίπεδο, θα υπάρξουν αναμφίβολα προσπάθειες για την εκπαίδευση των νευρωνικών δικτύων χρησιμοποιώντας τις εκφράσεις και τις χειρονομίες των ανθρώπων για τη δημιουργία βίντεο-αβατάρ, πιθανώς ακόμη και με μοναδικές φωνές χρηστών.

Η AI Audio είναι μια άλλη σημαντική πρόοδος που εισάγει μια νέα εποχή για τη βιομηχανία παραγωγής μουσικής. Αυτή η τεχνολογία έχει ήδη παρουσιάσει εκπληκτικές ευκαιρίες για τη σύνθεση τραγουδιών με βάση μόνο την είσοδο κειμένου, καθιστώντας την ένα εξαιρετικό εργαλείο για τη δημιουργία προσαρμοσμένων, μη-στοκ soundtracks για διάφορα είδη βίντεο περιεχομένου. Συνολικά, είναι πραγματικά διασκεδαστικό να ακούς κάτι τόσο банάλ όσο τα Όροι Χρήσης να ραπάρουν ή να τραγουδούν με ρομαντική ιντόνευση.

Ευχαριστώ για τη μεγάλη συνέντευξη, οι αναγνώστες που επιθυμούν να μάθουν περισσότερα ή να γεννήσουν κάποιες εικόνες πρέπει να επισκεφθούν ARTA.

Ο Antoine είναι ένας οραματιστής ηγέτης και συνιδρυτής του Unite.AI, οδηγείται από μια αμετάβλητη страсть για το σχήμα και την προώθηση του μέλλοντος του AI και της ρομποτικής. Ένας σειριακός επιχειρηματίας, πιστεύει ότι το AI θα είναι τόσο διαταρακτικό για την κοινωνία όσο η ηλεκτρική ενέργεια, και συχνά πιάνεται να μιλάει για το δυναμικό των διαταρακτικών τεχνολογιών και του AGI.

Ως futurist, είναι αφοσιωμένος στο να εξερευνήσει πώς αυτές οι καινοτομίες θα σχήματίσουν τον κόσμο μας. Επιπλέον, είναι ο ιδρυτής του Securities.io, μια πλατφόρμα που επικεντρώνεται στις επενδύσεις σε τεχνολογίες που αναedefinουν το μέλλον και ανασχήματίσουν ολόκληρους τομείς.