Συνεντεύξεις
Ο Onur Alp Soner, Διευθύνων Σύμβουλος και Συνιδρυτής της Countly – Σειρά Συνεντεύξεων

Ο Onur Alp Soner είναι ο συνιδρυτής και Διευθύνων Σύμβουλος της Countly, μιας ψηφιακής πλατφόρμας ανάλυσης και εμπλοκής εντός εφαρμογών. Ως τεχνολόγος και αυτοδημιούργητος, ξεκίνησε την Countly από το μηδέν για να δώσει στις εταιρείες περισσότερο έλεγχο sobre το πώς κατανοούν και αλληλεπιδρούν με τους χρήστες τους. Υπό την ηγεσία του, η Countly έχει εξελιχθεί σε μια αξιόπιστη πλατφόρμα για επιχειρήσεις παγκοσμίως που θέλουν να καινοτομούν γρήγορα διατηρώντας την ιδιωτικότητα των χρηστών στο κέντρο των στρατηγικών τους ανάπτυξης
Μας πήγαινε πίσω στη στιγμή που σας οδήγησε να ιδρύσετε την Countly — τι ήταν αυτό που σας έκανε να πιστεύετε ότι το μοντέλο ιδιοκτησίας δεδομένων ήταν θεμελιωδώς ελαττωματικό;
Περίπου 13 χρόνια πριν, όταν οι εφαρμογές για κινητά άρχισαν να αναπτύσσονται, τα εργαλεία ανάλυσης που ήταν διαθέσιμα ακολούθουν ένα πολύ συγκεκριμένο μοντέλο. Πολλά από αυτά ήταν δωρεάν ή tương đối φθηνά, αλλά η ανταλλαγή ήταν ότι η πλατφόρμα συλλέγει και εκμεταλλεύεται τα δεδομένα σας, συχνά τα οποία τα έβαζε σε οικονομίες διαφήμισης. Την εποχή εκείνη, αυτό θεωρούνταν rộngρά ως ο κανονικός τρόπος που λειτουργούσαν τα πράγματα.
Αυτό, ωστόσο, δεν μας έκανε να νιώθουμε καλά. Ακόμη και ως μια μικρή εταιρεία, η ιδέα να παραδώσουμε όλα τα δεδομένα των χρηστών μας μόνο και μόνο για να κατανοήσουμε πώς η εφαρμογή μας εκτελείται δεν είχε νόημα.
Η Countly ξεκίνησε ως απάντηση σε αυτό. Θέλαμε να χτίσουμε ανάλυση που οι εταιρείες θα μπορούσαν να κατέχουν και να ελέγχουν πλήρως, και γι’ αυτό την εκκίνηση ως ανοικτού κώδικα, αυτοφωστής πλατφόρμα. Η ιδέα ήταν απλή: οι οργανισμοί θα πρέπει να能够 να κατανοήσουν και να ενεργήσουν στα δεδομένα τους χωρίς να τα δώσουν. Αυτό το αρχή παραμένει στο κέντρο της Countly σήμερα.
Από την ίδρυση της Countly, η τεχνητή νοημοσύνη έχει ωθήσει την ιδιοκτησία δεδομένων από μια μειονεκτική ανησυχία σε μια στρατηγική απαιτούμενη. Πότε έγινε σαφές ότι αυτό το αρχή θα είχε σημασία πολύ πέρα από την ανάλυση;
Στις πρώτες années, οι περισσότερες συζητήσεις γύρω από την ιδιοκτησία δεδομένων ήταν κατευθυνμένες μέσω της ιδιωτικότητας ή της συμμόρφωσης. Ήταν κυρίως οι τράπεζες, οι πάροχοι υγείας και οι κυβερνήσεις που ενδιαφέρονταν πολύ για το πού ζούσαν τα δεδομένα τους και ποιος τα ελέγχει. Για πολλούς άλλους, η ανάλυση ήταν ακόμη θεωρούμενη ως ένα απλό εργαλείο αναφοράς, οπότε το ζήτημα της ιδιοκτησίας δεν έ cảmείνονταν επείγον.
Αυτή η προοπτική άρχισε να αλλάζει καθώς οι εταιρείες άρχισαν να βασίζονται περισσότερο στα δεδομένα για να τρέξουν τις εφαρμογές τους, όχι μόνο να τις μετρήσουν. Μόλις η ανάλυση μετακινήθηκε από την αναφορά στην λήψη αποφάσεων, την προσωποποίηση, τις αλλαγές προϊόντων και την αλληλεπίδραση πελατών, η σημασία του ελέγχου των δεδομένων έγινε πολύ πιο σαφής. Κάθε εταιρεία ψηφιακής πρώτης, από την κινητικότητα στην φιλοξενία, άρχισε effectively να ανταγωνίζεται στα δεδομένα, όχι μόνο στην εμπειρία του προγράμματος.
Η τεχνητή νοημοσύνη έχει επιταχύνει αυτή τη συνειδητοποίηση δραματικά. Μπορείτε να αδειοδοτήσετε ή να χτίσετε ένα μοντέλο τεχνητής νοημοσύνης, αλλά δεν μπορείτε να αγοράσετε τα δεδομένα συμπεριφοράς που αντανακλούν πώς οι δικοί σας πελάτες αλληλεπιδρούν με την εφαρμογή σας. Αυτά τα δεδομένα είναι μοναδικά για κάθε οργανισμό.
Πολυάριθμες οργανώσεις πιστεύουν ότι είναι “έτοιμες για τη τεχνητή νοημοσύνη” επειδή έχουν μεγάλες ποσότητες δεδομένων. Από ό,τι βλέπετε μέσα στις πραγματικές εταιρείες, τι είναι συνήθως λείπει κάτω από την επιφάνεια;
Η έλλειψη δεδομένων συνήθως δεν είναι το πρόβλημα. Το πραγματικό ζήτημα είναι η έλλειψη δεδομένων που μπορούν να χρησιμοποιηθούν. Πολυάριθμες οργανώσεις έχουν τεράστιες ποσότητες πληροφοριών, αλλά αυτά τα δεδομένα είναι θραυσματικά διασκορπισμένα σε διαφορετικά εργαλεία, ομάδες και συστήματα. Για παράδειγμα, η ομάδα μάρκετινγκ μπορεί να έχει ένα σύνολο δεδομένων, το προϊόν άλλο, και η μηχανική τηλεμετρία της, συχνά αποθηκευμένη σε διαφορετικές μορφές με λίγη κοινή δομή.
Για την τεχνητή νοημοσύνη να είναι χρήσιμη, τα δεδομένα κάτω από αυτή πρέπει να είναι καθαρά, συνεπή και περιεκτικά. Δεν είναι αρκετό να συλλέγουμε γεγονότα ή καταγραφές; πρέπει να κατανοήσουμε τι αυτά τα σήματα αντιπροσωπεύουν. Χωρίς αυτή τη σημασιολογική στρώση, τα συστήματα τεχνητής νοημοσύνης είναι ουσιαστικά μαντεύματα.
Ένα άλλο ζήτημα είναι η ιδιοκτησία. Ένα εκπληκτικό αριθμό εταιρειών δεν ελέγχουν πραγματικά τα δικά τους δεδομένα επειδή αυτά βρίσκονται μέσα σε τρίτες πλατφόρμες. Αυτό κάνει δύσκολο να συνδυάσετε σύνολα δεδομένων, να κυβερνήσετε πώς χρησιμοποιούνται, ή να εφαρμόσετε ασφαλώς μοντέλα τεχνητής νοημοσύνης σε αυτά.
Έτσι, όταν οι εταιρείες λένε ότι είναι “έτοιμες για τη τεχνητή νοημοσύνη” επειδή έχουν πολλά δεδομένα, το πραγματικό ζήτημα είναι αν έχουν μια συνεκτική βάση δεδομένων.
Γιατί η πρώτη-πλευρική δεδομένα δημιουργούν μια ανθεκτική ανταγωνιστική πλεονεκτική θέση σε συστήματα τεχνητής νοημοσύνης, ενώ τα μοντέλα αυτά γίνονται ολοένα και πιο ανταλλάξιμα;
Τι δημιουργεί ανθεκτική πλεονεκτική θέση δεν είναι το μοντέλο ίδιο, αλλά η κατανόηση των χρηστών που προέρχεται από τα πρώτα-πλευρικά δεδομένα. Αυτά τα δεδομένα αντανακλούν πώς οι άνθρωποι αλληλεπιδρούν πραγματικά με την εφαρμογή σας, και είναι μοναδικά για κάθε οργανισμό. Τα μοντέλα, από την άλλη πλευρά, γίνονται ολοένα και πιο εμπορεύματα. Μπορείτε να αδειοδοτήσετε, να επιδιορθώσετε, ή να αλλάξετε μεταξύ παρόχων σχετικά εύκολα. Τι δεν μπορείτε να αναπαραγάγετε είναι τα δεδομένα συμπεριφοράς που παράγονται από τους δικούς σας χρήστες που αλληλεπιδρούν με τις εφαρμογές σας με την πάροδο του χρόνου.
Αυτά τα δεδομένα καταγράφουν μοτίβα, контекστ και σήματα που αντανακλούν πώς οι πελάτες πραγματικά συμπεριφέρονται. Όταν είναι δομημένα και κατανοητά σωστά, επιτρέπουν στις εταιρείες να χτίσουν συστήματα που μαθαίνουν συνεχώς από την πραγματική χρήση και όχι από γενικά σύνολα δεδομένων.
Πού οι σύγχρονες στοίβες ανάλυσης σπάζουν ήσυχα όταν επαναχρησιμοποιούνται για συστήματα τεχνητής νοημοσύνης αντί για αναφορές, πίνακες ελέγχου και KPI;
Τείνουν να σπάζουν στο σημείο όπου τα δεδομένα πρέπει να μεταφερθούν από την παρατήρηση στην ενέργεια. Οι παραδοσιακές στοίβες ανάλυσης σχεδιάστηκαν κυρίως για αναφορές. Συλλέγουν και συνδυάζουν δεδομένα, και στη συνέχεια τα παρουσιάζουν σε πίνακες ελέγχου που βοηθούν τις ομάδες να κατανοήσουν τι συνέβη χθες ή την περασμένη εβδομάδα.
Τα συστήματα τεχνητής νοημοσύνης, ωστόσο, λειτουργούν πολύ διαφορετικά. Απαιτούν δεδομένα που είναι δομημένα, περιεκτικά και διαθέσιμα σε πραγματικό χρόνο, ώστε να μπορέσουν να επηρεάσουν trực tiếp πώς ένα σύστημα συμπεριφέρεται. Όταν οι στοίβες ανάλυσης είναι χτισμένες γύρω από την επεξεργασία batch και την καθυστερημένη αναφορά, αγωνίζονται να υποστηρίξουν συστήματα που χρειάζονται να αντιδράσουν αμέσως.
Πώς η έλλειψη πραγματικής ιδιοκτησίας δεδομένων εμφανίζεται λειτουργικά όταν οι ομάδες προσπαθούν να μεταφέρουν την τεχνητή νοημοσύνη από πειράματα σε παραγωγή;
Συνήθως εμφανίζεται ως πρόβλημα ελέγχου. Τελικά, αν δεν έχετε έλεγχο над τα δεδομένα σας, δεν έχετε έλεγχο над την τεχνητή νοημοσύνη σας. Αυτό γίνεται ιδιαίτερα σαφές όταν οι ομάδες μεταφέρουν από πειράματα σε παραγωγή. Κατά τη διάρκεια των πειραμάτων, οι ομάδες μπορούν συχνά να εργαστούν με μικρά σύνολα δεδομένων ή προσωρινές πipelines, αλλά τα συστήματα παραγωγής απαιτούν συνεπή πρόσβαση σε αξιόπιστη δεδομένα σε όλη την οργάνωση.
Τότε, σε πολλές εταιρείες, τα υποκείμενα δεδομένα κατοικούν σε διαφορετικές τρίτες πλατφόρμες, όπως εργαλεία ανάλυσης, συστήματα μάρκετινγκ ή υπηρεσίες cloud. Αυτό κάνει δύσκολο να συνδυάσετε σύνολα δεδομένων, να εφαρμόσετε κανόνες διακυβέρνησης, ή να μεταφέρετε δεδομένα μεταξύ συστημάτων με einen ελεγχόμενο τρόπο. Αυτό είναι ένας λόγος για τον οποίο πολλά проекта τεχνητής νοημοσύνης παραμένουν κολλημένα σε πειραματικές φάσεις. Χωρίς δομημένα, οργανωμένα δεδομένα, γίνεται δύσκολο να αναπτύξετε την τεχνητή νοημοσύνη αξιόπιστα σε παραγωγή.
Επίσης, κάνει πιο δύσκολο να ιχνηλατήσετε πώς ένα μοντέλο έφτασε σε μια απόφαση ή να ανακατασκευάσετε την ακριβή κατάσταση δεδομένων πίσω από αυτό. Χωρίς αυτό το επίπεδο ελέγχου, η διόρθωση σφαλμάτων ή η αναστροφή αποφάσεων γίνεται εξαιρετικά δύσκολο.
Γιατί η κακή δομή δεδομένων, σημασιολογία και контекστ υπονομεύουν ακόμη και τα πιο ικανά μοντέλα τεχνητής νοημοσύνης;
Ακόμη και τα πιο ικανά μοντέλα τεχνητής νοημοσύνης είναι μόνο τόσο καλά όσο τα δεδομένα που λαμβάνουν. Αν τα υποκείμενα δεδομένα είναι κακώς δομημένα ή λείπουν контекστ, το μοντέλο έχει πολύ λίγη κατανόηση για τι αυτά τα σήματα αντιπροσωπεύουν.
Σε πολλά συστήματα, τα δεδομένα συλλέγονται ως απομονωμένα γεγονότα ή καταγραφές χωρίς μια σαφή έννοια που να τους είναι προσαρμοσμένη. Ένα μοντέλο μπορεί να δει χιλιάδες αλληλεπιδράσεις, αλλά χωρίς την κατάλληλη δομή και σημασιολογία, δεν μπορεί να διακρίνει τι είναι σημαντικό και τι είναι απλώς θόρυβος.
Ο контекστ είναι επίσης σημαντικός. Τα συστήματα τεχνητής νοημοσύνης χρειάζονται να κατανοήσουν πώς τα διαφορετικά κομμάτια δεδομένων σχετίζονται μεταξύ τους με την πάροδο του χρόνου. Χωρίς αυτόν τον контекστ, τα μοντέλα μπορεί να παράγουν εξόδους, αλλά είναι συχνά αξιόπιστα επειδή το σύστημα εργάζεται με ελλιπή πληροφορίες.
Τι προειδοποιητικά σημάδια δείχνουν ότι μια εταιρεία προχωράει προς γενικές εξελίξεις τεχνητής νοημοσύνης πολύ πριν αυτές οι εμπειρίες να φαίνονται γενικές στους πελάτες;
Το πιο βασικό προειδοποιητικό σημάδι είναι όταν οι εταιρείες βασίζονται στις ίδιες εξωτερικές μοντέλα και εργαλεία τεχνητής νοημοσύνης αλλά δεν κάνουν τίποτα για να αναπτύξουν τις δικές τους βάσεις δεδομένων. Αν οι οργανισμοί χρησιμοποιούν τα ίδια μοντέλα αλλά δεν τα τροφοδοτούν με τα δικά τους δεδομένα χρηστών και контεκστ, τα συστήματα εργάζονται ουσιαστικά με τις ίδιες γενικές εισόδους. Σε αυτή τη κατάσταση, η τεχνητή νοημοσύνη μπορεί να παράγει μόνο υψηλού επιπέδου ή γενικές αποτελέσματα. Με την πάροδο του χρόνου, αυτό οδηγεί σε προϊόντα που φαίνονται ολοένα και πιο παρόμοια επειδή η νοημοσύνη πίσω από αυτά είναι χτισμένη στις ίδιες περιορισμένες πληροφορίες.
Ένα άλλο προειδοποιητικό σημάδι είναι όταν οι οργανισμοί εστιάζουν έντονα στην υιοθέτηση μοντέλων τεχνητής νοημοσύνης αλλά δεν δίνουν προσοχή στην δομή και την ποιότητα των δεδομένων τους. Η τεχνητή νοημοσύνη ενισχύει τι λαμβάνει. Αν τα υποκείμενα δεδομένα είναι ακατάστατα, θραυσματικά, ή κακώς δομημένα, το σύστημα θα παράγει απλώς μια πιο εξελιγμένη έκδοση του ίδιου προβλήματος.
Για τις οργανώσεις που προσπαθούν να χτίσουν τεχνητή νοημοσύνη πάνω στα δικά τους δεδομένα, τι μπορεί να κάνει η Countly που δεν μπορούν οι παραδοσιακές ανάλυση και πλατφόρμες δεδομένων;
Η βασική διαφορά είναι το πώς ο έλεγχος είναι χτισμένος στην πλατφόρμα. Σε πολλά προϊόντα ανάλυσης, η ιδιοκτησία δεδομένων είναι κάτι που εμφανίζεται ως μια επιλογή ή χαρακτηριστικό. Με την Countly, αυτή η ιδιοκτησία βρίσκεται στο κέντρο του συστήματος. Η πλατφόρμα σχεδιάστηκε ώστε οι οργανισμοί να μην πρέπει να ανταλλάξουν τον έλεγχο των δεδομένων τους για προηγμένα χαρακτηριστικά.
Στην πράξη, αυτό σημαίνει ότι οι εταιρείες μπορούν να εκτελέσουν την Countly στο δικό τους περιβάλλον, να διατηρήσουν τον πλήρη έλεγχο του σταδίου δεδομένων τους, και να έχουν ακόμη πρόσβαση σε ανάλυση, εμπλοκή και αυτοματοποίηση ικανοτήτων σε κλίμακα. Αυτό γίνεται ιδιαίτερα σημαντικό όταν οι οργανισμοί θέλουν να χτίσουν τεχνητή νοημοσύνη πάνω στα δικά τους δεδομένα. Πολλά παραδοσιακά εργαλεία ανάλυσης είναι χτισμένα κυρίως για αναφορές, οπότε τα δεδομένα που συλλέγουν συχνά παραμένουν μέσα σε τρίτες πλατφόρμες αντί να γίνουν μια χρήσιμη βάση για άλλα συστήματα. Η Countly ακολουθεί μια διαφορετική προσέγγιση αντιμετωπίζοντας την ανάλυση ως μέρος της υποκείμενης υποδομής δεδομένων.
Όταν τα συστήματα τεχνητής νοημοσύνης γίνονται ενσωματωμένα στην ημερήσια λήψη αποφάσεων, πώς πρέπει να εξελιχθεί η ορισμός της ηθικής τεχνητής νοημοσύνης όταν η ιδιοκτησία δεδομένων αντιμετωπίζεται ως ένα βασικό αρχή σχεδιασμού αντί για μια πολιτική checkbox;
Μόλις η ιδιοκτησία δεδομένων γίνει ένα αρχή σχεδιασμού, η ηθική τεχνητής νοημοσύνης δεν είναι πλέον για την επιθεώρηση μοντέλων μετά το γεγονός – είναι για την κατασκευή συστημάτων όπου οι χρήστες διατηρούν την ελευθερία πάνω στα δεδομένα που τα εκπαιδεύουν. Η ηθική γίνεται υποδομή.
Ευχαριστούμε για τη μεγάλη συνέντευξη, οι αναγνώστες που θέλουν να μάθουν περισσότερα πρέπει να επισκεφθούν την Countly.












