Συνδεθείτε μαζί μας

Off-the-shelf vs Custom Machine Learning Models;

AI 101

Off-the-shelf vs Custom Machine Learning Models;

mm
Εκτός ραφιού έναντι προσαρμοσμένων μοντέλων

Πότε είναι καλύτερο να χτίζετε από το να αγοράζετε μια λύση στο ράφι;

Οι εταιρείες μπορούν να συμμετάσχουν σε διαφορετικές προσεγγίσεις για την ανάπτυξη μοντέλων. Από πλήρως διαχειριζόμενες υπηρεσίες ML, μέχρι προσαρμοσμένα μοντέλα. Ανάλογα με τις επιχειρηματικές απαιτήσεις, τη διαθέσιμη τεχνογνωσία και τους περιορισμούς προγραμματισμού, πρέπει να κάνουν μια επιλογή: πρέπει να αναπτύξουν προσαρμοσμένες λύσεις από την αρχή; Ή θα πρέπει να επιλέξουν μια υπηρεσία εκτός ραφιού;

Για όλα τα στάδια του φόρτου εργασίας ML, πρέπει να ληφθεί μια απόφαση σχετικά με το πώς θα ταιριάζουν τα διαφορετικά κομμάτια του παζλ. Από τη συλλογή δεδομένων, την προετοιμασία και την οπτικοποίηση, μέχρι τη μηχανική χαρακτηριστικών, την εκπαίδευση μοντέλων και την αξιολόγηση, οι μηχανικοί μηχανικής μάθησης θέτουν επανειλημμένα την ίδια ερώτηση: Θα είναι μια προσαρμοσμένη εφαρμογή λύση, γραμμένη και αναπτυγμένη από την αρχή; Ή θα είναι μια υπηρεσία εκτός ραφιού;

Αλλά πότε η κατασκευή είναι καλύτερη από την αγορά μιας λύσης εκτός ραφιού; Οι κύριοι παράγοντες διαφοροποίησης μεταξύ των δύο προσεγγίσεων: οι προσπάθειες προεπεξεργασίας, η ταχύτητα ανάπτυξης και η απαιτούμενη τεχνογνωσία.

Τι πρέπει να λάβετε υπόψη όταν αποφασίζετε να χρησιμοποιήσετε μοντέλα εκμάθησης εκτός ραφιού ή προσαρμοσμένων μοντέλων μηχανικής εκμάθησης;

Προσπάθειες προεπεξεργασίας

Τα έργα ML αντιμετωπίζουν κάθε είδους προκλήσεις, αλλά ίσως η μεγαλύτερη πρόκληση είναι η διαθεσιμότητα των δεδομένων εκπαίδευσης. Η έλλειψη δεδομένων εκπαίδευσης μπορεί να σταματήσει ένα έργο πριν καν ξεκινήσει. Πριν καν ξεκινήσει ένα έργο, μπορεί να αντιμετωπίσει σημαντικό κόστος προεπεξεργασίας από τη συλλογή δεδομένων, την επισήμανση δεδομένων, τον καθαρισμό και τις προσπάθειες προεπεξεργασίας. Αυτή είναι η γνωστή παγίδα στην οποία πολλά έργα ML αποτυγχάνουν: η προεπεξεργασία καταλήγει να παίρνει το 80% των πόρων που διατίθενται, ενώ λίγοι πόροι απομένουν για την πραγματική εκπαίδευση και αξιολόγηση του μοντέλου.

Οι λύσεις εκτός ραφιού ανακουφίζουν τις καταπονήσεις και τους πόνους των προσπαθειών προεπεξεργασίας. Είναι κατασκευασμένα για να εκτελούν τις πιο συνηθισμένες λειτουργίες με λίγη μόνο ρύθμιση που απαιτείται. Το καλύτερο με αυτά είναι: υπάρχουν λύσεις εκτός ραφιού για όλα τα στάδια του φόρτου εργασίας ML.

Από την άλλη πλευρά, οι προσαρμοσμένες υλοποιήσεις απαιτούν συνήθως περισσότερες προσπάθειες προεπεξεργασίας. Αυτό δεν σημαίνει ότι πρέπει να απορριφθούν εντελώς: εξακολουθούν να απαιτείται να προσαρμόσουν με ακρίβεια ένα συγκεκριμένο στάδιο ML στις ιδιαιτερότητες του προβλήματος που επιλύεται. Ένα ιδιαίτερα βρώμικο σύνολο δεδομένων μπορεί να απαιτεί κάποιο ειδικό είδος κανόνων καθαρισμού. Ταυτόχρονα, ένα συγκεκριμένο σύνολο χαρακτηριστικών μπορεί να απαιτεί προσαρμοσμένη μηχανική χαρακτηριστικών, όπως και οι νευρωνικές αρχιτεκτονικές μπορεί να απαιτούν μικρές προσαρμογές. Σε αυτήν την περίπτωση, προσαρμοσμένες λύσεις που δημιουργήθηκαν από την αρχή είναι πιθανό να καλύψουν όλες τις ανάγκες.

Ταχύτητα ανάπτυξης 

Οι λύσεις εκτός ραφιού επικεντρώνονται στη διαμόρφωση παρά στην υλοποίηση. Αντί να διαθέσουμε πόρους για να καταλάβουμε τι πρέπει να γίνει, οι ομάδες ML θα επικεντρωθούν Αυτό που μπερδεύει, είναι το πώς. τα διαφορετικά κομμάτια του παζλ θα ταιριάζουν μεταξύ τους. Αυτή η προσέγγιση επιτρέπει σε εταιρείες, ερευνητές και μηχανικούς να εφαρμόσουν γρήγορα πρωτότυπα και αποδείξεις ιδέας. Αντί να εφευρίσκουν εκ νέου τον τροχό, οι λύσεις εκτός ραφιού καθιστούν δυνατή την αξιοποίηση της υπάρχουσας γνώσης, εξοικονομώντας έτσι χρόνο ανάπτυξης.

Οι εξατομικευμένες λύσεις που υλοποιούνται από την αρχή είναι γνωστό ότι έχουν πολύ πιο αργή ταχύτητα ανάπτυξης wrt. Αυτό οφείλεται στις αυξημένες ανάγκες συντήρησης: οι μηχανικοί πρέπει να καταλάβουν και τα δύο τι και την Αυτό που μπερδεύει, είναι το πώς. της λύσης. Ομοίως, όσο πιο περίπλοκη είναι η λύση, τόσο περισσότερος χρόνος απαιτούνται για να διασφαλιστεί η επεκτασιμότητα και η διαθεσιμότητά της κατά την παραγωγή. Από αυτή την άποψη, οι εξατομικευμένες λύσεις και οι προσπάθειες χρόνου είναι ευθέως ανάλογες: όσο πιο περίπλοκη είναι μια λύση, τόσο περισσότερος χρόνος θα χρειαστεί.

Συνήθως, ωστόσο, η αλήθεια βρίσκεται κάπου στη μέση: μια υπάρχουσα βάση κωδικών θα αναδημιουργηθεί και θα προσαρμοστεί στις ανάγκες του τρέχοντος έργου. Τέτοια είναι η περίπτωση της γνωστής προσέγγισης μάθησης μεταφοράς στην εκπαίδευση μοντέλου.

Εμπειρογνωμοσύνη

Ακριβώς όπως υπάρχουν πολλαπλά επίπεδα στα οποία γίνεται η Μηχανική Μάθηση, υπάρχουν πολλά επίπεδα εξειδίκευσης στα οποία μπορούν να αναπτυχθούν μοντέλα ML, που κυμαίνονται από διεπαφές χωρίς κώδικα μέχρι την κατασκευή μοντέλων από την αρχή.

Υπάρχουν λύσεις εκτός ραφιού για τις οποίες απαιτείται πολύ λίγη εξειδίκευση στη μηχανική εκμάθηση. Χρησιμοποιώντας διαισθητικές διεπαφές και ακόμη και προσεγγίσεις μεταφοράς και απόθεσης, έχει γίνει εξαιρετικά απλό για οποιονδήποτε (από επιχειρησιακούς αναλυτές έως μηχανικούς λογισμικού) να δημιουργήσει και να αναπτύξει κάποιο είδος μοντέλου μηχανικής εκμάθησης. Αν και αυτή η απλή προσέγγιση στην ανάπτυξη μοντέλων μπορεί να λειτουργήσει για σκοπούς δημιουργίας πρωτοτύπων, είναι απίθανο να ανταποκρίνεται στις απαιτήσεις των συστημάτων παραγωγής.

Εξακολουθεί να απαιτείται τεχνογνωσία για τη σωστή διαμόρφωση, ρύθμιση και διατήρηση λύσεων εκτός ραφιού στην παραγωγή. Οι λύσεις, οι ενημερώσεις κώδικα, η σύνδεση σε διαφορετικές διεπαφές API και η αντιμετώπιση ζητημάτων ανάπτυξης είναι κοινές εργασίες που απαιτούνται για τη διασφάλιση της απόδοσης των μοντέλων σε περιβάλλοντα παραγωγής.

Οι εξατομικευμένες λύσεις εφαρμόζονται συνήθως σε επίπεδο υποδομής και δεν υπάρχει τρόπος να το παρακάμψετε: σίγουρα απαιτείται τεχνογνωσία. Ανάλογα με το μέγεθος της εταιρείας και τους στόχους του έργου, ενδέχεται να απαιτούνται διεπιστημονικές ομάδες για τη συντήρηση των συστημάτων παραγωγής. Επιστήμονες δεδομένων, μηχανικοί ML και επιχειρησιακοί αναλυτές συγκεντρώνονται για να βγάλουν νόημα από τα αποτελέσματα συμπερασμάτων και να διατηρήσουν μοντέλα παραγωγής.

Τι πρέπει να χρησιμοποιήσετε: α εκτός ραφιού ή προσαρμοσμένο μοντέλο μηχανικής εκμάθησης;

Μια λύση ML θα κατασκευαστεί από πολλά επιμέρους στοιχεία και υπηρεσίες που πρέπει να ενωθούν ως μια συνεκτική λύση. Ποτέ δεν πρόκειται για 100% προσαρμοσμένο ή 100% από το ράφι, καθώς διαφορετικά επιχειρηματικά προβλήματα απαιτούν διαφορετικές λύσεις. Τις περισσότερες φορές, οι λύσεις που βασίζονται σε ML δημιουργούνται από έναν συνδυασμό των δύο: υπηρεσίες εκτός ραφιού για την εξαγωγή γενικών πληροφοριών, σε συνδυασμό με προσαρμοσμένα μοντέλα για αυξημένη ακρίβεια και μοντελοποίηση γνώσεων για συγκεκριμένο τομέα.

Το κόλπο είναι να γνωρίζετε πότε πρέπει να εφαρμόσετε προσαρμοσμένες λύσεις από την αρχή και ποια μέρη του έργου μπορούν να αξιοποιήσουν τα οφέλη από τις υπηρεσίες εκτός ραφιού. Αυτό εξαρτάται σε μεγάλο βαθμό από τον τύπο του προβλήματος που αντιμετωπίζεται, τις επιχειρηματικές απαιτήσεις, τα διαθέσιμα δεδομένα και τους γενικούς περιορισμούς του περιβάλλοντος ανάπτυξης.

Για περισσότερα σχετικά με τις τάσεις της τεχνητής νοημοσύνης και της τεχνολογίας, βλ Τζος Μίραμαντ, Διευθύνων Σύμβουλος των λύσεων που βασίζονται σε δεδομένα της Blue Orange Digital για Εφοδιαστικής Αλυσίδας, Αυτοματοποίηση εγγράφων υγειονομικής περίθαλψης και πολλά άλλα.

Μπορεί επίσης να σας αρέσει:

Χρησιμοποιήστε το NLP για να ταξινομήσετε σχόλια στα μέσα κοινωνικής δικτύωσης

Πώς ενισχύεται η επεξεργασία γλώσσας μέσω του μοντέλου BERT ανοιχτού κώδικα της Google  

Ο Josh Miramant είναι ο Διευθύνων Σύμβουλος και ιδρυτής του Blue Orange Digital, μια κορυφαία εταιρεία επιστήμης δεδομένων και μηχανικής μάθησης με γραφεία στη Νέα Υόρκη και την Ουάσιγκτον DC. Η Miramant είναι δημοφιλής ομιλητής, μελλοντολόγος και στρατηγικός σύμβουλος επιχειρήσεων και τεχνολογίας σε επιχειρήσεις και νεοφυείς επιχειρήσεις. Βοηθά τους οργανισμούς να βελτιστοποιήσουν και να αυτοματοποιήσουν τις επιχειρήσεις τους, να εφαρμόσουν αναλυτικές τεχνικές βάσει δεδομένων και να κατανοήσουν τις επιπτώσεις των νέων τεχνολογιών όπως η τεχνητή νοημοσύνη, τα μεγάλα δεδομένα και το Διαδίκτυο των πραγμάτων.