Ηγέτες σκέψης
Πώς μπορούμε να χρησιμοποιήσουμε το Deep Learning με Λιγότερα Δεδομένα; – Thought Leaders

Όταν πρόκειται για τη διατήρηση της ενημέρωσης σχετικά με τις επερχόμενες τάσεις της κυβερνοασφάλειας, η διαδικασία της παρακολούθησης των πρόσφατων εξελίξεων μπορεί να γίνει khá κουραστική, καθώς υπάρχει πολλή ειδήσεις για να παρακολουθήσουμε. Αυτές τις μέρες, ωστόσο, η κατάσταση έχει αλλάξει δραματικά, καθώς οι κόσμοι της κυβερνοασφάλειας φαίνεται να περιστρέφονται γύρω από δύο λέξεις- deep learning.
Αν και αρχικά μας έπιασε ξαφνικά η τεράστια κάλυψη που έλαβε το deep learning, σύντομα έγινε σαφές ότι ο θόρυβος που δημιουργήθηκε από το deep learning ήταν καλοσκοπευμένος. Σε μια μόδα παρόμοια με τον ανθρώπινο εγκέφαλο, το deep learning επιτρέπει σε ένα μοντέλο AI να επιτύχει εξαιρετικά ακριβή αποτελέσματα, εκτελώντας εργασίες trực tiếp από το κείμενο, τις εικόνες και τις ηχητικές ενδείξεις.
Μέχρι αυτό το σημείο, πιστευόταν ευρέως ότι το deep learning βασίζεται σε ένα τεράστιο σύνολο δεδομένων, παρόμοιο με το μέγεθος των δεδομένων που φιλοξενούν οι γίγαντες του Silicon Valley Google και Facebook για να επιτύχουν τον σκοπό της επίλυσης των πιο σύνθετων προβλημάτων внутри μιας οργανώσης. Αντιθέτως, ωστόσο, οι επιχειρήσεις μπορούν να αξιοποιήσουν τη δύναμη του deep learning, ακόμη και με πρόσβαση σε einen περιορισμένο πула δεδομένων.
Σε μια προσπάθεια να βοηθήσουμε τους αναγνωστές μας με τις απαραίτητες γνώσεις για να εξοπλίσουν την οργάνωση τους με deep learning, abbiamo συλλέξει ένα άρθρο που潜ει βαθιά (χωρίς πλάγια) σε einige από τους τρόπους με τους οποίους οι επιχειρήσεις μπορούν να αξιοποιήσουν τα οφέλη του deep learning, παρά την πρόσβαση σε περιορισμένα, ή “μικρά” δεδομένα.
Αλλά πριν μπορέσουμε να εισέλθουμε στο κέντρο του άρθρου, θα θέλαμε να κάνουμε μια μικρή, αλλά εξαιρετικά απαραίτητη πρόταση- αρχίστε απλά. Ωστόσο, πριν ξεκινήσετε να διαμορφώνετε νευρωνικά δίκτυα περίπλοκα enough να εμφανιστούν σε μια ταινία επιστημονικής φαντασίας, αρχίστε να πειραματίζεστε με quelques απλά και συμβατικά μοντέλα, (π.χ. τυχαίος δρυμός) για να πάρει το χέρι του λογισμικού.
Με αυτό το σημείο, ας εισέλθουμε σε einige από τους τρόπους με τους οποίους οι επιχειρήσεις μπορούν να συνδυάσουν την τεχνολογία του deep learning, ενώ έχουν πρόσβαση σε περιορισμένα δεδομένα.
#1- Fine-lining το baseline μοντέλο:
Όπως έχουμε ήδη αναφέρει παραπάνω, το πρώτο βήμα που πρέπει να κάνουν οι επιχειρήσεις μετά από έχουν διαμορφώσει ένα απλό baseline deep learning μοντέλο είναι να το fine-tune για το συγκεκριμένο πρόβλημα που αντιμετωπίζουν.
Ωστόσο, το fine-tuning ενός baseline μοντέλου φαίνεται πολύ δύσκολο στο χαρτί, παρά το ότι είναι στην πραγματικότητα. Η θεμελιώδης ιδέα πίσω από το fine-tuning ενός μεγάλου συνόλου δεδομένων για να ικανοποιήσει τις συγκεκριμένες ανάγκες μιας επιχείρησης είναι απλή- παίρνετε ένα μεγάλο σύνολο δεδομένων, που έχει κάποια ομοιότητα με το domaine που λειτουργείτε, και στη συνέχεια fine-tune τις λεπτομέρειες του αρχικού συνόλου δεδομένων, με τα περιορισμένα δεδομένα σας.
Όσο αφορά την απόκτηση του μεγάλου συνόλου δεδομένων, οι ιδιοκτήτες των επιχειρήσεων μπορούν να βασιστούν στο ImageNet, το οποίο παρέχει επίσης μια εύκολη λύση σε οποιαδήποτε πρόβλημα ταξινόμησης εικόνων, καθώς και. Το σύνολο δεδομένων που φιλοξενείται από το ImageNet επιτρέπει στις οργανώσεις να έχουν πρόσβαση σε εκατομμύρια εικόνες, οι οποίες είναι διαχωρισμένες σε πολλές κατηγορίες εικόνων, οι οποίες μπορούν να είναι χρήσιμες για τις επιχειρήσεις που προέρχονται από eine ποικιλία τομέων, συμπεριλαμβανομένων, αλλά όχι περιορισμένων σε εικόνες ζώων, κ.λπ.
Εάν η διαδικασία του fine-tuning ενός pre-εκπαιδευμένου μοντέλου για να ικανοποιήσει τις συγκεκριμένες ανάγκες της οργάνωσής σας vẫn φαίνεται σαν πολύ δουλειά για σας, θα σας συνιστούσαμε να ζητήσετε βοήθεια από το διαδίκτυο,既然 μια απλή αναζήτηση στο Google θα σας παρέχει εκατοντάδες οδηγούς για το πώς να fine-tune ένα σύνολο δεδομένων.
#2- Συλλογή περισσότερων δεδομένων:
Αν και το δεύτερο σημείο στη λίστα μας μπορεί να φαίνεται αναχρονιστικό σε alguns από τους πιο κυνικούς αναγνωστές μας, το γεγονός παραμένει- όταν πρόκειται για deep learning, το μεγαλύτερο το σύνολο δεδομένων σας, το πιο πιθανό είναι να επιτύχετε πιο ακριβή αποτελέσματα.
Αν και η ουσία του άρθρου μας έγκειται στην παροχή επιχειρήσεων με περιορισμένα δεδομένα, abbiamo συχνά την δυσάρεστη εμπειρία να συναντάμε πολλούς “υψηλούς”, οι οποίοι αντιμετωπίζουν την επένδυση στη συλλογή δεδομένων ως ισοδύναμη με την επένδυση σε ένα καρδιακό αμάρτημα.
Είναι πολύ συχνά ότι οι επιχειρήσεις παραβλέπουν τα οφέλη που προσφέρονται από το deep learning, απλά και μόνο επειδή είναι απρόθυμες να επενδύσουν χρόνο και προσπάθεια στη συλλογή δεδομένων. Εάν η επιχείρησή σας είναι αβέβαιη σχετικά με το ποσό δεδομένων που πρέπει να συλλεχθούν, θα σας συνιστούσαμε να.plot τις καμπύλες μάθησης, καθώς τα επιπλέον δεδομένα ενσωματώνονται στο μοντέλο, και να παρακολουθήσετε την αλλαγή της απόδοσης του μοντέλου.
Αντίθετα με την κοινή πεποίθηση που διατηρούν πολλοί CSO και CISO, đôiες φορές ο καλύτερος τρόπος για να λυθούν προβλήματα είναι μέσω της συλλογής περισσότερων σχετικών δεδομένων. Ο ρόλος του CSO και CISO είναι εξαιρετικά σημαντικός σε αυτή την περίπτωση, καθώς υπάρχει πάντα η απειλή των κυβερνοεπιθέσεων. Βρέθηκε ότι το 2019, η συνολική παγκόσμια δαπάνη για κυβερνοασφάλεια ανήλθε σε 103,1 δισεκατομμύρια δολάρια, και ο αριθμός συνεχίζει να αυξάνεται. Για να το θέσουμε σε προοπτική, ας θεωρήσουμε ένα απλό παράδειγμα- φανταστείτε ότι προσπαθούσατε να ταξινομήσετε σπάνια διαμάντια, αλλά έχετε πρόσβαση σε ένα πολύ περιορισμένο σύνολο δεδομένων. Όπως το πιο προφανές λύση στο πρόβλημα, αντί να έχετε μια μέρα με το baseline μοντέλο, απλά συλλέξτε περισσότερα δεδομένα!
#3- Data Augmentation:
Αν και τα δύο πρώτα σημεία που abbiamo συζητήσει παραπάνω είναι και τα δύο εξαιρετικά αποτελεσματικά στην παροχή μιας εύκολης λύσης σε meisten προβλήματα που περιβάλλουν την εφαρμογή του deep learning σε επιχειρήσεις με περιορισμένα δεδομένα, αυτά βασίζονται σε ένα certo επίπεδο τύχης για να ολοκληρώσουν την εργασία.
Εάν δεν можете να έχουν επιτυχία με το fine-tuning ενός pre-υπάρχοντος συνόλου δεδομένων, θα σας συνιστούσαμε να δοκιμάσετε την data augmentation. Ο τρόπος με τον οποίο η data augmentation είναι απλός. Μέσω της διαδικασίας της data augmentation, το σύνολο δεδομένων εισόδου τροποποιείται, ή aumenta, με τέτοιο τρόπο που να δίνει μια νέα έξοδο, χωρίς να αλλάξει την τιμή του label.
Για να θέσουμε την ιδέα της data augmentation σε προοπτική για τους αναγνωστές μας, ας θεωρήσουμε μια εικόνα ενός σκύλου. Όταν περιστραφεί, ο θεατής της εικόνας θα μπορεί ακόμα να πει ότι είναι μια εικόνα ενός σκύλου. Αυτό είναι ακριβώς αυτό που η data augmentation επιδιώκει να επιτύχει, σε αντίθεση με μια περιστραμμένη εικόνα του δρόμου, η οποία αλλάζει τη γωνία της ανύψωσης και αφήνει πολύ χώρο για το αλγόριθμο του deep learning να φτάσει σε ένα λάθος συμπέρασμα, και να ηττηθεί ο σκοπός της εφαρμογής του deep learning από την αρχή.
Όταν πρόκειται για την επίλυση προβλημάτων που σχετίζονται με την ταξινόμηση εικόνων, η data augmentation διαδραματίζει ένα βασικό ρόλο στο πεδίο και φιλοξενεί eine ποικιλία τεχνικών data augmentation που βοηθούν το μοντέλο του deep learning να αποκτήσει μια βαθιά κατανόηση των διαφόρων κατηγοριών εικόνων.
Επιπλέον, όταν πρόκειται για την augmentation δεδομένων- οι δυνατότητες είναι praktisch ατελείωτες. Οι επιχειρήσεις μπορούν να εφαρμόσουν την data augmentation με πολλούς τρόπους, οι οποίοι περιλαμβάνουν NLP, και πειραματισμό με GANs, οι οποίοι επιτρέπουν στο αλγόριθμο να γεννήσει νέα δεδομένα.
#4- Εφαρμογή ενός συνδυαστικού αποτελέσματος:
Η τεχνολογία πίσω από το deep learning ορίζει ότι το δίκτυο είναι χτισμένο σε πολλά επίπεδα. Ωστόσο, αντίθετα με την κοινή πεποίθηση που διατηρούν πολλοί, αντί να θεωρήσετε κάθε επίπεδο ως μια “αύξηση” ιεραρχία χαρακτηριστικών, το τελικό επίπεδο υπηρετεί τον σκοπό της προσφοράς ενός συνδυαστικού μηχανισμού.
Η πεποίθηση ότι οι επιχειρήσεις με πρόσβαση σε περιορισμένα δεδομένα πρέπει να επιλέξουν να χτίσουν τα δίκτυά τους βαθιά ήταν επίσης μοιραία σε ένα NIPs paper, το οποίο αντανακλούσε την πεποίθηση που abbiamo εκφράσει παραπάνω. Οι επιχειρήσεις με μικρά δεδομένα μπορούν εύκολα να χειριστούν το συνδυαστικό αποτέλεσμα προς το συμφέρον τους, απλά χτίζοντας τα δίκτυα του deep learning τους βαθιά, μέσω του fine-tuning ή κάποιας άλλης εναλλακτικής.
#5- Ενσωμάτωση autoencoders:
Αν και το πέμπτο σημείο που abbiamo λάβει υπόψη έχει λάβει μόνο μια σχετική επιτυχία- είμαστε ακόμα σε συμφωνία με τη χρήση autoencoders για να προ-εκπαιδεύσουν ένα δίκτυο και να αρχικοποιήσουν το δίκτυο σωστά.
Ένας από τους μεγαλύτερους λόγους, εκτός από τις κυβερνοεπιθέσεις, για τους οποίους οι επιχειρήσεις δεν μπορούν να ξεπεράσουν τα αρχικά εμπόδια της ενσωμάτωσης του deep learning είναι επειδή της κακής αρχικοποίησης, και των πολλών πιθανοτήτων της. Η ανοικτή προ-εκπαίδευση συχνά οδηγεί σε κακή, ή λανθασμένη εκτέλεση της τεχνολογίας του deep learning, όπου οι autoencoders μπορούν να λάμψουν.
Η θεμελιώδης ιδέα πίσω από ένα νευρωνικό δίκτυο ορίζει τη δημιουργία ενός νευρωνικού δικτύου που προβλέπει τη φύση του συνόλου δεδομένων εισόδου. Εάν δεν είστε βέβαιοι για το πώς να χρησιμοποιήσετε einen autoencoder, υπάρχουν πολλά tutorials online που δίνουν σαφείς οδηγίες.
Συμπέρασμα:
Στο τέλος του άρθρου, θα θέλαμε να επαναλάβουμε αυτό που abbiamo πει σε όλο το άρθρο, με μια προσθήκη- την ενσωμάτωση γνώσεων που αφορούν το domaine στην διαδικασία μάθησης! Όχι μόνο η ενσωμάτωση της πολύτιμης γνώσης επιταχύνει τη διαδικασία μάθησης, αλλά cũng επιτρέπει στην τεχνολογία του deep learning να παράγει καλύτερα και πιο ακριβή αποτελέσματα.












