Συνεντεύξεις
Bobby Samuels, Συνιδρυτής και CEO της Protege – Σειρά Συνεντεύξεων

Bobby Samuels ηγείται της στρατηγικής και της εκτέλεσης της Protege σε προϊόν, go-to-market και διαμόρφωση κεφαλαίου. Συνίδρυσε την Protege το 2024 και έχει διατελέσει CEO από την ίδρυσή της. Υπό την ηγεσία του, η Protege έχει συγκεντρώσει 35 εκατομμύρια δολάρια σε χρηματοδότηση και έχει επεκταθεί σε 30 εκατομμύρια δολάρια σε GMV στο πρώτο πλήρες έτος λειτουργίας. Προηγουμένως, ο Bobby ήταν Γενικός Διευθυντής του Privacy Hub tại Datavant, όπου βοήθησε στην οδήγηση της ανάπτυξης της εταιρείας πριν από τη συγχώνευσή της με την Ciox Health, δημιουργώντας το μεγαλύτερο ουδέτερο οικοσύστημα υγείας στην ΗΠΑ. Νωρίτερα, ηγήθηκε των συνεργασιών tại LiveRamp, όπου ανέπτυξε εμπειρογνωσία στη δημιουργία ουδέτερων δικτύων δεδομένων. Ο Bobby κατέχει MBA από το Stanford Graduate School of Business και AB από το Harvard College, όπου ήταν Πρόεδρος του The Harvard Crimson. Φέρνει sâuστό εχέφρησμα σε ρυθμιζόμενη ανταλλαγή δεδομένων και μετάφραση σύνθετης υποδομής σε αξιόπιστη ενεργοποίηση AI για εταιρικούς συνεργάτες.
Protege είναι μια εταιρεία υποδομής δεδομένων που συνδέει ιδιοκτήτες υψηλής αξίας, ιδιόκτητων συνόλων δεδομένων με dévelopers που κατασκευάζουν μοντέλα AI, προσφέροντας einen governed και privacy-first τρόπο για να αδειοδοτήσουν και να προσεγγίσουν δεδομένα εκπαίδευσης σε κλίμακα. Ιδρυθείσα το 2024, η πλατφόρμα εστιάζει στην απομάκρυνση multimodal δεδομένων – όπως ιατρικά αρχεία, εικόνες, βίντεο και ήχο – που παραδοσιακά είναι δύσκολο για τις ομάδες AI να πηγαίνουν, ενώ δίνουν στους παρόχους δεδομένων πλήρη έλεγχο над την ιδιωτικότητα, τη συμμόρφωση και την εμπορευματοποίηση. Για τους κατασκευαστές AI, η Protege απλοποιεί την ανακάλυψη και την απόκτηση μέσω ενός κατηγοριοποιημένου καταλόγου και εργαλείων για το φιλτράρισμα και την συνδυασμένη χρήση συνόλων δεδομένων, βοηθώντας στην επιτάχυνση της ανάπτυξης σε τομείς όπως η υγεία, τα μέσα ενημέρωσης και άλλοι. Ουσιαστικά, η εταιρεία στοχεύει να γίνει ο αξιόπιστος δεδομένων στρώμα για AI, μειώνοντας ένα από τα μεγαλύτερα εμπόδια στη σύγχρονη ανάπτυξη μοντέλων.
Τι σας ενέπνευσε να ιδρύσετε την Protege, και πώς οι εμπειρίες σας στην ηγεσία δεδομένων, ιδιωτικότητας και οργανωτικών μετασχηματισμών στη Datavant — καθώς και στις προηγούμενες θέσεις σας στη LiveRamp — διαμόρφωσαν την όρασή σας για την κατασκευή της;
Η εμπειρία μου στη Datavant μου έδειξε τόσο την δύναμη όσο και τη σύνθετη σύνδεση δεδομένων υπεύθυνα σε κλίμακα. Η Datavant κατασκεύασε μια πλατφόρμα που βοήθησε να συνδέσει ευαίσθητες πληροφορίες υγείας ενώ διατηρούσε την ιδιωτικότητα του ασθενούς, και έγινε σαφές ότι καλά διακυβερνώμενα δεδομένα μπορούν να οδηγήσουν σε τεράστια κοινωνική πρόοδο. Αλλά όταν δεν είναι, μπορεί να προκαλέσει πραγματική ζημία.
Όταν το AI επιταχύνθηκε, είδα το ίδιο μοτίβο να επαναλαμβάνεται: εστίαση στο compute και τις αρχιτεκτονικές AI, αλλά όχι τόσο στα δεδομένα που οδηγούν τα μοντέλα themselves. Η υπόθεσή μας είναι ότι το επόμενο τεράστιο εμπόδιο είναι η πρόσβαση στα σωστά δεδομένα. Ήθελα να κατασκευάσω ένα στρώμα υποδομής δεδομένων που κάνει την ανταλλαγή δεδομένων ασφαλή, διαφανή και αμοιβαία ωφέλιμη για τους κατόχους δεδομένων και τους κατασκευαστές AI, ενώ παράλληλα παρέχει εμπειρογνωσία δεδομένων AI για την υποστήριξη ερευνητικών προόδων AI. Αυτό οδήγησε στην Protege.
Η Protege περιγράφεται ως η κατασκευή του “σπονδυλικού στήλης της οικονομίας δεδομένων AI”. Πώς ορίζετε αυτό το στρώμα, και τι είναι η αληθινή υποδομή δεδομένων για AI στην πράξη;
Η Protege είναι το συνδετικό ιστό που επιτρέπει στους ιδιοκτήτες δεδομένων και τους dévelopers AI να συνεργάζονται ασφαλώς και αποτελεσματικά. Η αληθινή υποδομή δεδομένων για AI κάνει περισσότερα από το να αποθηκεύει ή να μεταφέρει δεδομένα. Επιβεβαιώνει την προέλευση, διαχειρίζεται τις άδειες, και εξασφαλίζει ότι κάθε σύνολο δεδομένων χρησιμοποιείται ηθικά και με συγκατάθεση. Στην πράξη, είναι μια ενιαία πλατφόρμα όπου οι κάτοχοι περιεχομένου μπορούν να αδειοδοτήσουν δεδομένα με εμπιστοσύνη και να απολαύσουν την αντιστοίχως αποζημίωση, και οι dévelopers AI μπορούν να προσεγγίσουν τα κρίσιμα σύνολα δεδομένων σε διάφορους τομείς, περιοχές, modalities και μορφές που χρειάζονται για να εκπαιδεύσουν και να αξιολογήσουν μοντέλα υπεύθυνα.
Μια από τις βασικές αποστολές σας είναι η διασφάλιση ότι τα μοντέλα εκπαιδεύονται σε αδειοδοτημένα, αντιπροσωπευτικά και συναίνεση-βασισμένα σύνολα δεδομένων. Πώς η Protege λειτουργεί την ηθική πηγή σε κλίμακα;
Λειτουργούμε την ηθική μέσω συστημάτων, όχι σλόγκαν. Με κάθε πηγή δεδομένων και περιεχομένου που συλλέγουμε και παραδίδουμε, εξασφαλίζουμε ότι οι κάτοχοι δικαιωμάτων διατηρούν την ιδιοκτησία με σαφείς όρους αδειοδότησης και προστασίας ιδιωτικότητας.
Η πλατφόρμα μας συνδυάζει την ανθρώπινη, ερευνητική μας εμπειρογνωσία με pipelines δεδομένων και συστήματα που κλιμακώνουν για να παραδώσουν τα δεδομένα που προστατεύονται από δικαιώματα. Επίσης, συνεργαζόμαστε με τους πελάτες μας για να διασφαλίσουμε ότι τα δεδομένα είναι αντιπροσωπευτικά των πραγματικών πληθυσμών και ανακλούν πραγματικές περιπτώσεις χρήσης. Διευρύνοντας τόσο τους παρόχους δεδομένων όσο και τους αγοραστές με σαφήνεια και συνεπήτητα, μπορούμε να διατηρήσουμε τη συμμόρφωση, την ισότητα και την εμπιστοσύνη.
Η βιομηχανία AI έχει οδηγηθεί για πολύ καιρό από μια “σκραπ πρώτα, ρωτήστε αργότερα” νοοτροπία. Πώς βλέπετε τη διαφανή αδειοδότηση δεδομένων να αναμορφώνει τις σχέσεις μεταξύ παρόχων δεδομένων και dévelopers AI;
Η διαφάνεια μετατρέπει την εξόρυξη σε συνεργασία. Αντί να σκραπάρουν, οι εταιρείες AI έχουν την επιλογή να αδειοδοτήσουν δεδομένα ηθικά από ελεγμένους παρόχους δεδομένων, δημιουργώντας καλύτερες ενισχύσεις για και τις δύο πλευρές. Οι παρόχοι δεδομένων κερδίζουν έσοδα και έλεγχο, και οι dévelopers AI λαμβάνουν καθαρότερα, υψηλότερης ποιότητας σύνολα δεδομένων χωρίς νομικά και πνευματικά δικαιώματα.
Αυτή η μετατόπιση χτίζει εμπιστοσύνη, η οποία με τη σειρά της ξεκλειδώνει ταχύτητα στην ανάπτυξη AI. Όταν οι οργανισμοί βλέπουν ότι το AI μπορεί να χτιστεί υπεύθυνα με σαφή συγκατάθεση και αποζημίωση για δικαιώματα δεδομένων, αυτό ξεκλειδώνει περισσότερες περιπτώσεις χρήσης και ανάγκες δεδομένων. Αυτό δημιουργεί περισσότερη ζήτηση για υψηλής ποιότητας σύνολα δεδομένων, ξεκινώντας ένα φυσικό γύρο: οι καλύτεροι πηγές δεδομένων ελκύουν αγοραστές, και οι αγοραστές ελκύουν περισσότερες πηγές δεδομένων υψηλής πιστότητας. Όλοι ωφελούνται.
Τα συνθετικά δεδομένα θεωρούνται συχνά ως λύση για προβλήματα ιδιωτικότητας και προκατάληψης. Πού πιστεύετε ότι βρίσκεται η σωστή ισορροπία μεταξύ συνθετικών και πραγματικών συνόλων δεδομένων, ιδιαίτερα σε υψηλά ρυθμιζόμενους τομείς όπως η υγεία;
Τα συνθετικά δεδομένα είναι χρήσιμα για δοκιμές και επαύξηση, αλλά δεν μπορούν να αντικαταστήσουν πλήρως την πλήρη νюανς και σύνθετη πραγματική δραστηριότητα που παράγει τα δεδομένα εκπαίδευσης και αξιολόγησης. Αυτό είναι ιδιαίτερα αληθινό στην υγεία, όπου η μακροχρόνια ιστορία φροντίδας ασθενούς και τα αποτελέσματα εντός του πλαισίου της φροντίδας έχουν σημασία.
Πιστεύουμε ουσιαστικά ότι το AI που δεν έχει εκπαιδευτεί στην πλήρη σύνθετη πραγματική δραστηριότητα δεν μπορεί να παράγει συνθετικά δεδομένα που αντιπροσωπεύουν την πραγματική πραγματικότητα. Πιθανότατα, η σωστή ισορροπία θα είναι μια υβριδική προσέγγιση, όπου θα χρειαζόμαστε πολλά περισσότερα χρήσιμα, υψηλής ποιότητας σύνολα δεδομένων που είναι τώρα απομονωμένα και χρειάζονται να απελευθερωθούν, και στη συνέχεια να συνδυάσουμε με AI-γεννημένα συνθετικά δεδομένα για συγκεκριμένες περιπτώσεις χρήσης.
Πώς η Protege ermögίζει στους οργανισμούς να μοιράζονται πολύτιμα πραγματικά δεδομένα ασφαλώς, χωρίς να εκθέτουν ιδιόκτητα πληροφορίες, δεδομένα ασθενούς ή πνευματική ιδιοκτησία;
Η ασφάλεια και η ιδιωτικότητα είναι ενσωματωμένες σε κάθε βήμα του ταξιδιού. Είτε πρόκειται για τα εσωτερικά μας συστήματα είτε για τους συνεργάτες μας αποπροσωποποίησης και προστασίας ιδιωτικότητας που επικυρώνουν τις μεταφορές μας δεδομένων, εξασφαλίζουμε ότι τα δεδομένα μας παραμένουν εντός των προβλεπόμενων ορίων.
Στην υγεία, αυτό σημαίνει συμμόρφωση με πλαισιά προστασίας ιδιωτικότητας και συμμόρφωσης για όλες τις μεταφορές δεδομένων. Στα μέσα ενημέρωσης, σημαίνει να εξασφαλίζουμε ότι το περιεχόμενο αδειοδοτείται μόνο για τις προβλεπόμενες χρήσεις με προκαθορισμένους όρους αδειοδότησης και διάρκεια.
Όταν τα μοντέλα foundation συνεχίζουν να εξελίσσονται, τι θα ορίσει την επόμενη γενιά υψηλής ποιότητας pipelines δεδομένων εκπαίδευσης;
Τρεις αρχές θα οδηγήσουν: προέλευση, ακρίβεια και σκοπός.
Η προέλευση σημαίνει πλήρη ιχνηλασιμότητα στην πηγή και τους όρους. Η ακρίβεια σημαίνει επιμέλεια για συγκεκριμένες modalities ή περιπτώσεις χρήσης αντί για γενικά σύνολα δεδομένων – ή δεδομένα που δεν είναι πλήρως αντιπροσωπευτικά των πραγματικών καταστάσεων. Ο σκοπός σημαίνει την ευθυγράμμιση της επιλογής δεδομένων με πραγματικά, συγκεκριμένα αποτελέσματα, όχι απλώς μετρήσεις vanities.
Μαζί, αυτά δημιουργούν einen δρόμο προς την利用ηση υψηλής ποιότητας δεδομένων για να οδηγήσουν καλύτερα μοντέλα.
Πώς οι αναδυόμενες ρυθμίσεις όπως ο νόμος AI της ΕΕ και τα επικείμενα αμερικανικά πλαίσια επηρεάζουν την προσέγγιση της Protege για τη συμμόρφωση και τη διασυνοριακή συνεργασία δεδομένων;
Αυτές οι ρυθμίσεις επικυρώνουν την προσέγγισή μας που βασίσαμε την εταιρεία. Τονίζουν τη διαφάνεια, την προέλευση και τη διαχείριση ризικού, τα οποία είναι ενσωματωμένα στα προϊόντα και την πλατφόρμα μας από προεπιλογή.
Πιστεύουμε ότι οι μελλοντικές ευκαιρίες AI πρέπει να προστατεύουν τους κατόχους δικαιωμάτων και να διατηρούν αυστηρικούς ελέγχους ιδιωτικότητας. Με την αντιμετώπιση αυτών των ζητημάτων ως μη διαπραγματεύσιμων, βοηθάμε τους παρόχους δεδομένων και τους πελάτες να προχωρήσουν με εμπιστοσύνη και εμπιστοσύνη στο συνεχώς μεταβαλλόμενο τοπίο AI. Ο στόχος μας είναι να κάνουμε την υπεύθυνη ανάπτυξη AI όχι μόνο το σωστό πράγμα να κάνετε, αλλά και το ευκολότερο πράγμα να κάνετε.
Τι ρόλο βλέπετε τη διαφάνεια και την προέλευση δεδομένων να παίζουν στην ανασυγκρότηση της δημόσιας εμπιστοσύνης στα συστήματα AI;
Η εμπιστοσύνη αρχίζει με την ιχνηλασιμότητα. Όταν οι άνθρωποι κατανοούν από πού προέρχονται τα δεδομένα και πώς χρησιμοποιούνται, είναι πιο πιθανό να εμπιστευτούν τα αποτελέσματα AI.
Η διαφάνεια και η προέλευση δημιουργούν ευθύνη από τον κάτοχο δεδομένων στον déveloper μοντέλων έως τον τελικό χρήστη. Μετατρέπουν το AI από ένα μαύρο κουτί σε κάτι πιο κατανοητό και εξηγημένο.
Μετά από 20x αύξηση και eine 25 εκατομμυρίων δολαρίων Σειρά Α, πώς ισορροπείτε την ταχεία κλιμάκωση με τη διατήρηση των ηθικών και ασφαλειών δεσμεύσεων της Protege — και τι είναι το επόμενο βήμα καθώς συνεχίζετε να διαμορφώνετε τον τρόπο με τον οποίο οι οργανισμοί εκπαιδεύουν μοντέλα AI υπεύθυνα;
Η ηθική και η ασφάλεια είναι η βάση που μας επιτρέπει να κλιμακωθούμε. Κάθε νέος процесс, συνεργασία και προϊόν μετράται με το να λειτουργούμε ως если άλλοι μας παρακολουθούν. Αν όλοι έβλεπαν πώς λειτουργούμε και τις αποφάσεις που λαμβάνουμε, θα ήθελα να είναι υπερήφανοι.
Όσο προχωράμε στο 2026, επεκτείνουμε την εμβέλεια μας σε νέες περιοχές πέρα από την υγεία και τα μέσα ενημέρωσης, καθώς και δημιουργούμε νέα προϊόντα δεδομένων όπως δεδομένα αξιολόγησης για την αξιολόγηση της απόδοσης AI, καθώς οι οργανισμοί AI προσπαθούν να μετρήσουν καλύτερα την απόδοση AI για πραγματικές περιπτώσεις χρήσης. Ο στόχος μας είναι να γίνουμε η μοναδική αξιόπιστη πλατφόρμα για πραγματικά δεδομένα AI και εμπειρογνωσία, κατασκευασμένη για να ενισχύσει την πρόοδο AI για μακροχρόνια.
Ευχαριστούμε για τη μεγάλη συνέντευξη, οι αναγνώστες που επιθυμούν να μάθουν περισσότερα πρέπει να επισκεφθούν Protege.












