Τεχνητή νοημοσύνη

Η παραδοσιακή μηχανική μάθηση εξακολουθεί να είναι σχετική;

Δημοσιευμένα

6 μήνες πριν

Νοέμβριος 6, 2023

Η παραδοσιακή μηχανική μάθηση εξακολουθεί να είναι σχετική;

Τα τελευταία χρόνια, η Generative AI έχει δείξει πολλά υποσχόμενα αποτελέσματα στην επίλυση πολύπλοκων εργασιών AI. Τα σύγχρονα μοντέλα AI όπως ChatGPT, Βάρδος, Είδος μικρής καμήλας, DALL-E.3, να SAM έχουν επιδείξει αξιοσημείωτες ικανότητες στην επίλυση πολυεπιστημονικών προβλημάτων όπως η οπτική απάντηση σε ερωτήσεις, η τμηματοποίηση, η συλλογιστική και η παραγωγή περιεχομένου.

Εξάλλου, Πολυτροπική τεχνητή νοημοσύνη έχουν προκύψει τεχνικές, ικανές να επεξεργάζονται πολλαπλούς τρόπους δεδομένων, π.χ. κείμενο, εικόνες, ήχο και βίντεο ταυτόχρονα. Με αυτές τις εξελίξεις, είναι φυσικό να αναρωτιόμαστε: Πλησιάζουμε στο τέλος του παραδοσιακή μηχανική μάθηση (ML);

Σε αυτό το άρθρο, θα εξετάσουμε την κατάσταση του παραδοσιακού τοπίου μηχανικής μάθησης σχετικά με τις σύγχρονες καινοτομίες τεχνητής νοημοσύνης.

Τι είναι η Παραδοσιακή Μηχανική Μάθηση; – Ποιοι είναι οι περιορισμοί του;

Η παραδοσιακή μηχανική εκμάθηση είναι ένας ευρύς όρος που καλύπτει μια μεγάλη ποικιλία αλγορίθμων που βασίζονται κυρίως στα στατιστικά στοιχεία. Οι δύο κύριοι τύποι παραδοσιακών αλγορίθμων ML είναι εποπτευόμενοι και χωρίς επίβλεψη. Αυτοί οι αλγόριθμοι έχουν σχεδιαστεί για την ανάπτυξη μοντέλων από δομημένα σύνολα δεδομένων.

Οι τυπικοί παραδοσιακοί αλγόριθμοι μηχανικής εκμάθησης περιλαμβάνουν:

Αλγόριθμοι παλινδρόμησης όπως γραμμικός, λάσος και κορυφογραμμή.
K-σημαίνει Ομαδοποίηση.
Ανάλυση Κύριων Στοιχείων (PCA).
Υποστήριξη Vector Machines (SVM).
Αλγόριθμοι που βασίζονται σε δέντρα όπως δέντρα αποφάσεων και τυχαίο δάσος.
Μοντέλα ενίσχυσης όπως η ενίσχυση κλίσης και XGBoost.

Περιορισμοί της Παραδοσιακής Μηχανικής Μάθησης

Το παραδοσιακό ML έχει τους ακόλουθους περιορισμούς:

Περιορισμένη επεκτασιμότητα: Αυτά τα μοντέλα χρειάζονται συχνά βοήθεια για την κλιμάκωση με μεγάλα και διαφορετικά σύνολα δεδομένων.
Προεπεξεργασία δεδομένων και μηχανική χαρακτηριστικών: Η παραδοσιακή ML απαιτεί εκτεταμένη προεπεξεργασία για τη μετατροπή συνόλων δεδομένων σύμφωνα με τις απαιτήσεις του μοντέλου. Επίσης, η μηχανική χαρακτηριστικών μπορεί να είναι χρονοβόρα και απαιτεί πολλαπλές επαναλήψεις για την καταγραφή σύνθετων σχέσεων μεταξύ των χαρακτηριστικών δεδομένων.
Δεδομένα υψηλών διαστάσεων και αδόμητα: Η παραδοσιακή ML αντιμετωπίζει πολύπλοκους τύπους δεδομένων, όπως εικόνες, ήχος, βίντεο και έγγραφα.
Προσαρμοστικότητα σε αόρατα δεδομένα: Αυτά τα μοντέλα μπορεί να μην προσαρμόζονται καλά σε δεδομένα του πραγματικού κόσμου που δεν ήταν μέρος τους δεδομένα κατάρτισης.

Νευρωνικό Δίκτυο: Μετάβαση από τη Μηχανική Μάθηση στη Βαθιά Μάθηση και πέρα

Τα μοντέλα νευρωνικών δικτύων (NN) είναι πολύ πιο περίπλοκα από τα παραδοσιακά μοντέλα Μηχανικής Μάθησης. Το απλούστερο NN - Perceptron πολλαπλών στρωμάτων (MLP) αποτελείται από πολλούς νευρώνες που συνδέονται μεταξύ τους για να κατανοούν πληροφορίες και να εκτελούν εργασίες, παρόμοιες με το πώς λειτουργεί ο ανθρώπινος εγκέφαλος.

Οι πρόοδοι στις τεχνικές νευρωνικών δικτύων έχουν αποτελέσει τη βάση για τη μετάβαση από μηχανική μάθηση σε βαθιά μάθηση. Για παράδειγμα, ονομάζονται NN που χρησιμοποιούνται για εργασίες όρασης υπολογιστή (ανίχνευση αντικειμένων και τμηματοποίηση εικόνας). συνελικτικά νευρωνικά δίκτυα (CNN), Όπως AlexNet, ResNet, να YOLO.

Σήμερα, η γενετική τεχνολογία AI πηγαίνει τις τεχνικές νευρωνικών δικτύων ένα βήμα παραπέρα, επιτρέποντάς της να διαπρέψει σε διάφορους τομείς τεχνητής νοημοσύνης. Για παράδειγμα, τα νευρωνικά δίκτυα που χρησιμοποιούνται για εργασίες επεξεργασίας φυσικής γλώσσας (όπως σύνοψη κειμένου, απάντηση ερωτήσεων και μετάφραση) είναι γνωστά ως μετασχηματιστές. Τα εξέχοντα μοντέλα μετασχηματιστών περιλαμβάνουν ΜΠΕΡΤ, GPT-4, να T5. Αυτά τα μοντέλα δημιουργούν αντίκτυπο σε κλάδους που κυμαίνονται από την υγειονομική περίθαλψη, το λιανικό εμπόριο, το μάρκετινγκ, χρηματοδότησηΚ.λπ.

Χρειαζόμαστε ακόμα παραδοσιακούς αλγόριθμους μηχανικής μάθησης;

Ενώ τα νευρωνικά δίκτυα και οι σύγχρονες παραλλαγές τους όπως οι μετασχηματιστές έχουν λάβει μεγάλη προσοχή, οι παραδοσιακές μέθοδοι ML παραμένουν ζωτικής σημασίας. Ας δούμε γιατί εξακολουθούν να είναι σχετικά.

1. Απαιτήσεις απλούστερων δεδομένων

Τα νευρωνικά δίκτυα απαιτούν μεγάλα σύνολα δεδομένων για εκπαίδευση, ενώ τα μοντέλα ML μπορούν να επιτύχουν σημαντικά αποτελέσματα με μικρότερα και απλούστερα σύνολα δεδομένων. Έτσι, η ML προτιμάται έναντι της βαθιάς μάθησης για μικρότερα δομημένα σύνολα δεδομένων και αντίστροφα.

2. Απλότητα και ερμηνευτικότητα

Τα παραδοσιακά μοντέλα μηχανικής μάθησης είναι χτισμένα πάνω σε απλούστερα στατιστικά μοντέλα και μοντέλα πιθανοτήτων. Για παράδειγμα, μια γραμμή που ταιριάζει καλύτερα γραμμικής παλινδρόμησης καθορίζει τη σχέση εισόδου-εξόδου χρησιμοποιώντας τη μέθοδο των ελαχίστων τετραγώνων, μια στατιστική πράξη.

Ομοίως, τα δέντρα αποφάσεων χρησιμοποιούν πιθανολογικές αρχές για την ταξινόμηση δεδομένων. Η χρήση τέτοιων αρχών προσφέρει ερμηνευτικότητα και διευκολύνει τους επαγγελματίες τεχνητής νοημοσύνης να κατανοήσουν τη λειτουργία των αλγορίθμων ML.

Σύγχρονες αρχιτεκτονικές NN όπως μοντέλα μετασχηματιστών και διάχυσης (συνήθως χρησιμοποιούνται για τη δημιουργία εικόνων όπως Σταθερή Διάχυση or Μεσοταξίδι) έχουν μια πολύπλοκη πολυεπίπεδη δομή δικτύου. Η κατανόηση τέτοιων δικτύων απαιτεί κατανόηση προηγμένων μαθηματικών εννοιών. Γι' αυτό αναφέρονται και ως «Μαύρα Κουτιά».

3. Αποδοτικότητα πόρων

Τα σύγχρονα νευρωνικά δίκτυα όπως τα μοντέλα μεγάλων γλωσσών (LLM) εκπαιδεύονται σε ομάδες ακριβών GPU ανάλογα με τις υπολογιστικές τους απαιτήσεις. Για παράδειγμα, το GPT4 φέρεται να εκπαιδεύτηκε 25000 GPU Nvidia για 90 έως 100 ημέρες.

Ωστόσο, το ακριβό υλικό και ο μεγάλος χρόνος εκπαίδευσης δεν είναι εφικτά για κάθε επαγγελματία ή ομάδα τεχνητής νοημοσύνης. Από την άλλη πλευρά, η υπολογιστική αποτελεσματικότητα των παραδοσιακών αλγορίθμων μηχανικής μάθησης επιτρέπει στους επαγγελματίες να επιτυγχάνουν ουσιαστικά αποτελέσματα ακόμη και με περιορισμένους πόρους.

4. Δεν χρειάζονται όλα τα προβλήματα βαθιά μάθηση

Βαθιά μάθηση δεν είναι η απόλυτη λύση για όλα τα προβλήματα. Υπάρχουν ορισμένα σενάρια όπου η ML υπερτερεί της βαθιάς μάθησης.

Για παράδειγμα, στο ιατρική διάγνωση και πρόγνωση με περιορισμένα δεδομένα, ένας αλγόριθμος ML για ανίχνευση ανωμαλιών όπως το REMED προσφέρει καλύτερα αποτελέσματα από τη βαθιά μάθηση. Ομοίως, η παραδοσιακή μηχανική εκμάθηση είναι σημαντική σε σενάρια με χαμηλή υπολογιστική ικανότητα ως α ευέλικτη και αποτελεσματική λύση.

Κατά κύριο λόγο, η επιλογή του καλύτερου μοντέλου για οποιοδήποτε πρόβλημα εξαρτάται από τις ανάγκες του οργανισμού ή του επαγγελματία και τη φύση του προβλήματος.

Μηχανική Μάθηση το 2023

Εικόνα που δημιουργήθηκε με χρήση Leonardo A.I.

Το 2023, η παραδοσιακή μηχανική μάθηση συνεχίζει να εξελίσσεται και ανταγωνίζεται τη βαθιά μάθηση και τη γενετική τεχνητή νοημοσύνη. Έχει πολλές χρήσεις στον κλάδο, ιδιαίτερα όταν πρόκειται για δομημένα σύνολα δεδομένων.

Για παράδειγμα, πολλοί Καταναλωτικά Αγαθά Γρήγορης Μετακίνησης (FMCG) οι εταιρείες ασχολούνται με μεγάλο όγκο δεδομένων σε πίνακα που βασίζονται σε αλγόριθμους ML για κρίσιμες εργασίες όπως εξατομικευμένες προτάσεις προϊόντων, βελτιστοποίηση τιμών, διαχείριση αποθέματος και βελτιστοποίηση της αλυσίδας εφοδιασμού.

Περαιτέρω, πολλοί όραμα και γλωσσικά μοντέλα εξακολουθούν να βασίζονται σε παραδοσιακές τεχνικές, προσφέροντας λύσεις σε υβριδικές προσεγγίσεις και αναδυόμενες εφαρμογές. Για παράδειγμα, μια πρόσφατη μελέτη με τίτλο «Χρειαζόμαστε πραγματικά μοντέλα βαθιάς μάθησης για την πρόβλεψη χρονοσειρών;» έχει συζητήσει πώς τα δέντρα παλινδρόμησης που ενισχύουν την κλίση (GBRT) είναι πιο αποτελεσματικά προβλέψεις χρονοσειρών παρά τα βαθιά νευρωνικά δίκτυα.

Η ερμηνευτικότητα της ML παραμένει πολύτιμη με τεχνικές όπως ΣΧΗΜΑ (Shapley Additive Explanations) και ΑΣΒΕΣΤΟΣ (Τοπικό ερμηνευτικό μοντέλο-αγνωστικές επεξηγήσεις). Αυτές οι τεχνικές εξηγούν πολύπλοκα μοντέλα ML και παρέχουν πληροφορίες σχετικά με τις προβλέψεις τους, βοηθώντας έτσι τους επαγγελματίες ML να κατανοήσουν ακόμα καλύτερα τα μοντέλα τους.

Τέλος, η παραδοσιακή μηχανική εκμάθηση παραμένει μια ισχυρή λύση για διάφορους κλάδους που αντιμετωπίζουν την επεκτασιμότητα, την πολυπλοκότητα δεδομένων και τους περιορισμούς πόρων. Αυτοί οι αλγόριθμοι είναι αναντικατάστατοι για ανάλυση δεδομένων και προγνωστική μοντελοποίηση και θα συνεχίσουν να αποτελούν μέρος ενός οπλοστάσιο του επιστήμονα δεδομένων.

Εάν θέματα όπως αυτό σας ιντριγκάρουν, εξερευνήστε Unite AI για περισσότερες πληροφορίες.