Συνεντεύξεις
Δρ. Yair Adato, Διευθύνων Σύμβουλος και Ιδρυτής της Bria – Σειρά Συνεντεύξεων

Δρ. Yair Adato, Διευθύνων Σύμβουλος και ιδρυτής της Bria, είναι ένας ειδικός στη μηχανική μάθηση και την υπολογιστική όραση που αναγνωρίζεται για την ικανότητά του να συνδέει την προηγμένη τεχνολογία με τις πραγματικές επιχειρηματικές εφαρμογές. Πριν ιδρύσει τη Bria, υπήρξε Διευθύνων Σύμβουλος της Trax Retail, όπου έπαιξε κεντρικό ρόλο στη μεταμόρφωση της εταιρείας από μια εταιρεία startup με 20 άτομα σε einen παγκόσμιο γίγαντα με περισσότερους από 850 υπαλλήλους. καθ’ όλη τη διάρκεια της καριέρας του, ο Yair έχει επίσης συμβουλεύσει διάφορες επιχειρήσεις που βασίζονται στη μηχανική μάθηση, συμπεριλαμβανομένων των Sparx, Vicomi, Tasq, DataGen και Anima. Η ηγεσία του χαρακτηρίζεται από μια ισχυρή δέσμευση για την υπεύθυνη καινοτομία, την ιδιοκτησία δεδομένων και την δημοκρατία της τεχνολογίας της μηχανικής μάθησης.
Bria είναι μια πρωτοποριακή εταιρεία στον τομέα της υπεύθυνης οπτικής γενετικής τεχνολογίας AI, ιδρυθείσα με αποστολή τη δημιουργία ενός ανοιχτού και ηθικού πλαισίου για την παραγωγή εικόνων. Η μοναδική προσέγγιση της εταιρείας ανταποδίδει τους ιδιοκτήτες δεδομένων για τις συνεισφορές τους μέσω ενός μηχανισμού αναφοράς, εξασφαλίζοντας τη διαφάνεια και τη δικαιοσύνη στο οικοσύστημα της τεχνολογίας AI. Εστιάζοντας στην δημιουργικότητα, τη συνεργασία και τη συμμόρφωση, η Bria ενδυναμώνει τις οργανώσεις να ενσωματώνουν την γενετική τεχνολογία AI ασφαλώς στις εργασίες τους, θέτοντας νέους προσταγματικούς κανόνες για την ευθύνη και την αξιοπιστία στη βιομηχανία του οπτικού περιεχομένου..
Ιδρύσατε τη Bria για να δημιουργήσετε ένα υπεύθυνο και ανοιχτό πλαίσιο για την οπτική γενετική τεχνολογία AI. Τι σας ενέπνευσε να ιδρύσετε την εταιρεία, και ποια πρώιμα προκλήματα ή επιτεύγματα διαμόρφωσαν την κατεύθυνσή της;
Είδα τον Goodfellow να παρουσιάζει το GAN paper το 2014, και ήταν αμέσως σαφές ότι η δημιουργική παραγωγή θα αλλάξει θεμελιωδώς. Παρακολουθώντας αυτήν την παρουσίαση, οι επιπτώσεις ήταν προφανείς—αυτό δεν ήταν απλώς ένα σταδιακό βήμα, ήταν ένα διαφορετικό παράδειγμα για το πώς οι μηχανές θα μπορούσαν να μάθουν να παράγουν οπτικό περιεχόμενο.
Αλλά από την αρχή, αναγνώρισα ένα θεμελιώδες κενό στο πώς αυτά τα συστήματα χτίζονταν: keine ευθύνη για τα δεδομένα εκπαίδευσης, kein πλαίσιο για την υπεύθυνη ανάπτυξη, keine σκέψη για τους δημιουργούς των οποίων το έργο έκανε όλα αυτά δυνατά.
Τα πρώιμα προκλήματα δεν ήταν τεχνικά—ήταν δομικά. Πώς να χτίσετε γενετική τεχνολογία AI που να ενισχύει το δημιουργικό έργο χωρίς να υπονομεύει τους ανθρώπους που το δημιουργούν; Πώς να κάνετε αυτά τα συστήματα να χρησιμοποιούνται σε περιβάλλοντα παραγωγής όπου η νομική βεβαιότητα έχει την ίδια σημασία με την ποιότητα εξόδου; Αυτά τα ερωτήματα διαμόρφωσαν όλα όσα χτίσαμε. Ιδρύσαμε τη Bria με βάση την αρχή ότι η καινοτομία και η υπεύθυνη δεν είναι αντίθετες δυνάμεις—πρέπει να προχωρήσουν μαζί, ή η τεχνολογία αποτυγχάνει για όλους.
Η ακαδημαϊκή σας υπόβαθρο στην υπολογιστική όραση και τα 50+ διπλώματα ευρεσιτεχνίας σας γέμισαν το χάσμα μεταξύ έρευνας και πραγματικής καινοτομίας. Πώς έχει επηρεάσει αυτή η εμπειρία τον τεχνικό δρόμο και τη μακροπρόθεσμη στρατηγική της Bria;
Η ερευνητική μου υπόβαθρο με δίδαξε να σκέφτομαι σε συστήματα—πώς διαφορετικά επίπεδα κατανόησης συνδέονται για να σχηματίσουν νόημα. Πολλά από τα διπλώματα ευρεσιτεχνίας μου επικεντρώνονται στο πώς οι μηχανές ερμηνεύουν τη δομή της οπτικής πληροφορίας, και αυτή η σκέψη μεταφέρθηκε φυσικά στην προσέγγιση της Bria. Βλέπουμε την παραγωγή εικόνων ως einen συνθετικό διαδικασία, όχι einen τυχαίο.
Αλλά τα διπλώματα ευρεσιτεχνίας δεν αφορούν μόνο την τεχνολογία—αφορούν το χτίσιμο του γέφυρας μεταξύ τεχνολογίας και επιχειρηματικής πραγματικότητας. Ένα σημαντικό μέρος του χαρτοφυλακίου μας διπλωμάτων ευρεσιτεχνίας ασχολείται με το επίπεδο των συστημάτων: πώς να δημιουργήσετε πλαισια αναφοράς που συνδέουν το παραγόμενο περιεχόμενο με τις πηγές εκπαίδευσής του; Πώς να χτίσετε οικονομικά μοντέλα που αποζημιώνουν τους δημιουργούς σε κλίμακα; Αυτά δεν είναι καθαρώς τεχνικά προβλήματα—είναι ερωτήματα υποδομής, επιχειρηματικών μοντέλων και σχεδιασμού αγοράς.
Αυτή η ευρύτερη άποψη διαμόρφωσε τη μακροπρόθεσμη στρατηγική μας. Η καινοτομία δεν αφορά μόνο την προώθηση των υποκείμενων μοντέλων. Αφορά τη δημιουργία νέων οικονομικών δομών, νέων συμβατικών πλαισίων, νέων τρόπων για την βιομηχανία να λειτουργεί βιώσιμα. Το στόχο δεν είναι μόνο να παράγει καλύτερα αποτελέσματα—είναι να κατανοήσουμε πώς αυτά τα αποτελέσματα σχηματίζονται, ποιος συνεισέφερε σε αυτά, και πώς η αξία ρέει μέσα από το σύστημα. Αυτό είναι όπου η επιστήμη συναντά τη σκέψη προϊόντος και τη βιομηχανική αρχιτεκτονική.
Η Bria ανακοίνωσε πρόσφατα το FIBO, που περιγράφεται ως το πρώτο детерμινιστικό οπτικό μοντέλο για την επαγγελματική παραγωγή AI. Τι κάνει το FIBO θεμελιωδώς διαφορετικό από τα υπάρχοντα οπτικά συστήματα AI;
Το όνομα ίδιο σηματοδοτεί την προσέγγισή μας: FIBO σημαίνει Fibonacci, τη μαθηματική ακολουθία που είναι знаменита για τις εγγενείς αισθητικές ιδιότητες. Η χρυσή αναλογία—η αναλογία μεταξύ συνεχόμενων αριθμών στη σειρά Fibonacci—εμφανίζεται σε αυτά που αντιλαμβανόμαστε ως οπτικά ευχάριστες αναλογίες σε μαθηματικά, οπτική τέχνη, γεωμετρία και αρχιτεκτονική. Το βλέπουμε στις διαστάσεις του Ρωμαϊκού Πανθέου και του Λευκού Οίκου, στο ανθρώπινο σώμα και το πρόσωπο όπως εικονογραφείται στο Vitruvian Man του Λεονάρντο ντα Βίντσι, και σε φυσικές μορφές. Αυτή η σύνδεση μεταξύ μαθηματικής δομής και οπτικής ομορφιάς είναι ακριβώς αυτό που το FIBO ενσωματώνει: αισθητική ποιότητα μέσω формικής δομής.
Το FIBO αλλάζει τη σχέση μεταξύ προθέσεων και εξόδου. Τα περισσότερα οπτικά συστήματα AI εισάγουν στρώματα ερμηνείας μεταξύ того που θέλετε και того που παίρνετε—γράψτε μια πρόταση, το μοντέλο τη μεταφράζει μέσω γλωσσικών κωδικοποιητών, τη διασκορπίζει μέσω θορύβου, και ελπίζετε ότι το αποτέλεσμα αντιστοιχεί στο όραμά σας. Το FIBO αφαιρεί αυτά τα στρώματα εντελώς.
Κάνουμε την οπτική AI να λειτουργεί όπως ο κώδικας—κάθε δημιουργικό στοιχείο γίνεται επεξεργάσιμο και επαναλαμβανόμενο. Αυτό είναι ένα βήμα για τους επαγγελματίες που έχουν μείνει κολλημένοι με το prompt roulette.. Αυτό σημαίνει ότι κάθε στοιχείο, κατεύθυνση φωτισμού, γωνία κάμερας, παλέτα χρωμάτων, σύνθεση, στυλ υπάρχει ως ρητή, ελεγχόμενη ιδιότητα. Η δομή JSON σας επιτρέπει να τροποποιήσετε μόνο τις παραμέτρους που θέλετε, ενώ κλειδώνει όλα τα άλλα. Μπορείτε να調整σετε την ένταση φωτισμού χωρίς να επηρεάσετε τη σύνθεση, ή να μετακινήσετε τη γωνία κάμερας χωρίς να αλλάξετε την παλέτα χρωμάτων. Το σύστημα κάνει ακριβώς αυτό που ορίζετε, κάθε φορά.
Εκτελούμε hackathons με Fal και NVIDIA για να δείξουμε στους dévelopπερες πώς λειτουργεί η детерμινιστική γενετική στην πράξη. Η δομή JSON herself ανοίγει το μαύρο κουτί—μπορείτε να δείτε ακριβώς ποιες παραμέτρους δημιούργησαν μια εικόνα, να την αναπαράγετε και να την τροποποιήσετε με ακρίβεια. Αυτό είναι ένα τελείως διαφορετικό παράδειγμα από την μηχανική πρότασης.
Τα παραδοσιακά συστήματα κειμένου-εικόνας βασίζονται σε όλο και πιο περίπλοκες πρότασης για την επίτευξη συγκεκριμένων αποτελεσμάτων. Πώς η προσέγγιση του FIBO λύνει το πρόβλημα της σύνθεσης πρότασης;
Δύο προβλήματα πρέπει να αντιμετωπιστούν. Πρώτον, τα προβλήματα τυχαίων προτάσεων υπάρχουν επειδή τα τρέχοντα μοντέλα προσπαθούν να εξάγουν την πρόθεση του χρήστη και να προσθέσουν αυτό που το μοντέλο «πιστεύει» ότι είναι αισθητικό ή επιθυμητό μέσω της βελτίωσης της πρότασης. Δεύτερον, η έλλειψη ελέγχου στις επαγγελματικές ιδιότητες
Το FIBO αντιστρέφει αυτό. Το μοντέλο εκπαιδεύτηκε σε περισσότερες από 1.000 λέξεις οπτικών περιγραφών ανά εικόνα που κωδικοποιούν ρητά πάνω από 100 ανεξάρτητες ιδιότητες σε μορφή JSON. Αυτό δεν ήταν μετα-επεξεργασμένο ή εξαγμένο—ήταν η εγγενής μορφή εκπαίδευσης. Επειδή κάθε ιδιότητα αντιπροσωπεύεται δομικά από την αρχή, το μοντέλο έμαθε την οπτική σύνθεση ως ένα σύνολο διακριτών, ελεγχόμενων παραμέτρων και όχι ως μια ασαφή ερμηνεία του κειμένου.
Αυτό σημαίνει στην πράξη: ορίζετε την αισθητική πρόθεση μέσω δομής, όχι μέσω «πρότασης και προσευχής». Το επίπεδο συσχέτισης κειμένου-εικόνας είναι θεμελιωδώς υψηλότερο επειδή δεν υπάρχει слой μετάφρασης. Μιλάτε τη μητρική γλώσσα του μοντέλου. Και επειδή οι ιδιότητες είναι ανεξάρτητες, μπορείτε να επαναλάβετε την ένταση φωτισμού χωρίς να αλλάξετε τη σύνθεση, ή να προσαρμόσετε την παλέτα χρωμάτων χωρίς να επηρεάσετε το στυλ. Ο έλεγχος είναι χειρουργικός.
Το FIBO εισάγει μια “βελτίωση” ροή εργασίας που διαφέρει από την τυπική επαναληπτική γενετική. Πώς αλλάζει αυτό τον τρόπο με τον οποίο οι επαγγελματίες προσεγγίζουν την οπτική παραγωγή;
Οι περισσότερες γενετικές ροές εργασίας είναι επαναληπτικές με έναν εκνευριστικό τρόπο—γεννάτε, αξιολογείτε, điều chỉnhσετε την πρότασή σας, γεννάτε ξανά, ελπίζοντας ότι είναι πιο κοντά. αυτό το «πρόταση και προσευχή». Δεν είστε ποτέ σίγουροι τι άλλαξε ή γιατί.
Η βελτίωση μετατρέπει την πειραματική διαδικασία σε σχεδιασμό. Δεν μαντεύετε τι θα κάνει μια νέα πρόταση—στερείτε την εικόνα, ακριβώς όπως θα调είτε το φως ή το χρώμα στο Photoshop. . Δεν χρειάζεται να εργαστείτε στο επίπεδο JSON απευθείας—ένα μοντέλο όρασης-γλώσσας τροποποιεί το JSON για σας με βάση φυσική γλώσσα οδηγίες. Αλλά το ίδιο το JSON σας επιτρέπει να κατανοήσετε ακριβώς τι συνέβη. Γεννάτε μια αρχική εικόνα, εξετάζετε την αναπαράσταση JSON της, αναγνωρίζετε ποίες ιδιότητες χρειάζονται προσαρμογή—ίσως η ένταση φωτισμού είναι πολύ υψηλή, ή η γωνία κάμερας χρειάζεται να μετατοπιστεί 15 μοιρών—και τροποποιείτε μόνο αυτές τις τιμές μέσω απλών οδηγιών. Όλα τα άλλα παραμένουν κλειδωμένα.
Αυτή η δομή είναι ιδανική για εργασίες που βασίζονται σε πράκτορες. Ένας πράκτορας AI μπορεί να αναλύσει το JSON, να κατανοήσει την πλήρη κατάσταση της εικόνας, να κάνει στοχευμένες τροποποιήσεις και να εξηγήσει το λόγο—όλα επειδή οι παράμετροι είναι ρητές και ερμηνεύσιμες. Ο πράκτορας δεν μαντεύει τι θα κάνει μια αλλαγή πρότασης—κάνει ακριβείς điều chỉnhσεις σε γνωστές ιδιότητες.
Αυτό αφαιρεί την αβεβαιότητα που έχει κρατήσει τους επαγγελματίες σκεπτικιστές για την γενετική AI. Όταν μπορείτε να δείτε το πλήρες σύνολο παραμέτρων που δημιούργησε μια εικόνα, να κατανοήσετε τι ελέγχει κάθε ιδιότητα και να τροποποιήσετε με ακρίβεια με την εμπιστοσύνη ότι τίποτα άλλο δεν θα μετατοπιστεί, δεν πειραματίζεστε πλέον—σχεδιάζετε. Η ορατότητα του JSON ανοίγει το μαύρο κουτί完全. Για επαγγελματικές ροές παραγωγής όπου η συνεκτικότητα και ο έλεγχος έχουν περισσότερη σημασία από την καινοτομία, αυτό είναι η διαφορά μεταξύ ενός δημιουργικού παιχνιδιού και ενός εργαλείου παραγωγής.
Η ηθική των δεδομένων και η ασφάλεια του brand έχουν γίνει κεντρικές για τις επιχειρήσεις AI. Πώς η χρήση της Bria από πλήρως αδειοδοτημένα, δικαιωμένα δεδομένα εξασφαλίζει και την συμμόρφωση και τον σεβασμό για την πνευματική ιδιοκτησία των δημιουργών;
Από την πρώτη ημέρα, αποφασίσαμε ότι αν η βιομηχανία θα μεγαλώσει υπεύθυνα, πρέπει να αρχίσει με την ακεραιότητα των δεδομένων. Κάθε εικόνα που εκπαίδευσε το FIBO προέρχεται από αδειοδοτημένες, δικαιωμένες πηγές μέσω συνεργασιών με ηγέτες περιεχομένου όπως η Getty Images και η Envato. Αυτό εξασφαλίζει ότι τα μοντέλα μας είναι συμμορφωμένα και δίκαια. Βλέπουμε τον σεβασμό για τους δημιουργούς ως μέρος της αλυσίδας αξίας, όχι ως ένα περιορισμό. Οι επιχειρήσεις ωφελούνται από αυτήν την ακεραιότητα επειδή τους δίνει τη νομική και ηθική βεβαιότητα που χρειάζονται για να κλιμακωθούν με εμπιστοσύνη.
Το FIBO εκπαιδεύτηκε για να μάθει το μοναδικό στυλ και ταυτότητα κάθε εταιρείας. Πώς αλλάζει αυτή η ικανότητα τον τρόπο με τον οποίο οι παγκόσμιες μάρκες προσεγγίζουν τη δημιουργία περιεχομένου και την οπτική συνεκτικότητα;
Οι μάρκες έχουν το δικό τους οπτικό DNA—έναν μοναδικό τρόπο εκφράζοντας συναισθήματα, εμπιστοσύνη και σκοπό μέσω σχεδιασμού. Το FIBO μπορεί να μάθει αυτήν τη γλώσσα. Μόλις εκπαιδευτεί, παράγει οπτικά που αντανακλούν την ίδια σύνθεση, τόνο και ατμόσφαιρα που ορίζουν την ταυτότητα της μάρκας. Αυτό μετατρέπει την AI από ένα δημιουργικό βοηθό σε ένα περιουσιακό στοιχείο μάρκας. Βοηθά τις παγκόσμιες ομάδες να δημιουργούν με συμμόρφωση, όχι με προσέγγιση. Το αποτέλεσμα είναι συνεκτικότητα σε κλίμακα χωρίς να χάνεται η ατομικότητα.
Με τους πρώτους χρήστες που ήδη χρησιμοποιούν το FIBO για την αυτοματοποίηση του σχεδιασμού συσκευασίας, της προϊοντικής εικόνας και των δημιουργικών καμπανιών, ποια αποτελέσματα ή σχόλια σας έχουν κάνει να σταθείτε πιο πολύ μέχρι τώρα;
Η αλλαγή στο μυαλό. Οι ομάδες αρχίζουν να αντιμετωπίζουν την AI ως μέρος του εργαλείου τους, όχι ως μια νεωτερικότητα. Μια παγκόσμια μάρκα παράγει περιφερειακές παραλλαγές συσκευασίας πολύ πιο γρήγορα ενώ διατηρεί τη συνεκτικότητα της μάρκας. Một ηγετική δημιουργική εταιρεία έχει επιταχύνει την ανάπτυξη καμπανιών δέκα φορές μέσω ελεγχόμενης επανάληψης. Αλλά το πραγματικό σήμα έρχεται από τους δημιουργικούς διευθυντές που μας λένε ότι чувствují daha πολύ ελεγχόμενοι· ότι το μοντέλο κατανοεί την οπτική τους πρόθεση. Αυτό είναι ένα σημείο καμπής για την βιομηχανία.
Η Bria θέτει τον εαυτό της ως ηγέτη στην ηθική και τον έλεγχο της AI. Πώς βλέπετε αυτήν τη φιλοσοφία να διαμορφώνει τις μελλοντικές ρυθμίσεις ή τις βιομηχανικές προδιαγραφές για την οπτική AI;
Έχουμε φτάσει σε ένα σημείο όπου η καινοτομία και η διακυβέρνηση πρέπει να προχωρήσουν μαζί. Η ρύθμιση δεν είναι ένα εμπόδιο, αλλά μάλλον η υποδομή για τη βιώσιμη ανάπτυξη. Η προσέγγισή μας — διαφανή δεδομένα, детерμινιστικά αποτελέσματα, σαφής προέλευση — συμφωνεί στενά με αυτά που ζητούν οι αναδυόμενες πολιτικές. Πιστεύω ότι θα δούμε νέες προδιαγραφές που θα δώσουν προτεραιότητα στη διαφάνεια, την εξηγήσιμη και την προστασία δικαιωμάτων. Η φιλοσοφία της Bria είναι να βοηθήσει να οριστούν αυτές οι προδιαγραφές μέσω της πρακτικής, όχι των δηλώσεων πολιτικής.
Κοιτάζοντας μπροστά, τι είναι το επόμενο για τη Bria μετά το FIBO; Εικονίζετε την επέκταση σε πολυμεσική AI που ενώνει την εικόνα, το βίντεο και την 3D γενετική υπό ένα ελεγχόμενο πλαίσιο;
Ναι. Οι ίδιες αρχές που δίνουν τη δύναμη στο FIBO—δομή, έλεγχος, διαφάνεια—ισχύουν σε όλα τα οπτικά πεδία. Ήδη εξερευνούμε επεκτάσεις στο βίντεο και την 3D, όπου ο детерμινισμός μπορεί να φέρει την ίδια αξιοπιστία που έχουν οι επιχειρήσεις τώρα με τις εικόνες. Ο στόχος μας είναι απλός: να κάνουμε την AI δημιουργικότητα τόσο ελεγχόμενη και ασφαλή όσο η γραφή κώδικα—και να την επεκτείνουμε σε κάθε οπτικό μέσο, από εικόνα σε βίντεο σε 3D.
Ευχαριστούμε για τη μεγάλη συνέντευξη, οι αναγνώστες που επιθυμούν να μάθουν περισσότερα πρέπει να επισκεφθούν Bria.












