Connect with us

Προσαρμοσμένα LLMs για κάθε Επιχείρηση; Η DeepSeek μας Δείχνει τον Δρόμο

Ηγέτες σκέψης

Προσαρμοσμένα LLMs για κάθε Επιχείρηση; Η DeepSeek μας Δείχνει τον Δρόμο

mm

Μια φορά κι ένα καιρό, η κλήση του τεχνολογικού κλάδου ήταν “κινητά τηλέφωνα για όλους” – και πράγματι, οι κινητές επικοινωνίες έχουν επανακατασκευάσει τον επιχειρηματικό κόσμο (και τον κόσμο). Σήμερα, το ισοδύναμο αυτής της κλήσης είναι να δώσουμε σε όλους πρόσβαση σε εφαρμογές AI. Αλλά η πραγματική δύναμη του AI βρίσκεται στο να το αξιοποιήσουμε για τις συγκεκριμένες ανάγκες των επιχειρήσεων και των οργανισμών. Ο δρόμος που άνοιξε η κινεζική εταιρεία DeepSeek δείχνει πώς το AI μπορεί πραγματικά να αξιοποιηθεί από όλους, ιδιαίτερα από εκείνους με περιορισμένα бюджета, για να καλύψουν τις συγκεκριμένες ανάγκες τους. Πράγματι, η έλευση του φθηνότερου AI υποσχέται να αλλάξει το βαθιά ριζωμένο μοτίβο των λύσεων AI που συχνά παραμένουν εκτός οράματος για πολλές μικρές επιχειρήσεις και οργανισμούς λόγω των απαιτήσεων κόστους.

Τα LLMs είναι – ή ήταν – μια ακριβή επιχείρηση, που απαιτεί πρόσβαση σε τεράστιες ποσότητες δεδομένων, μεγάλο αριθμό ισχυρών υπολογιστών για την επεξεργασία των δεδομένων και χρόνο και πόρους που επενδύονται στην εκπαίδευση του μοντέλου. Αλλά αυτές οι κανόνες αλλάζουν. Λειτουργώντας με ένα προϋπολογισμό σε σχοινί, η DeepSeek ανέπτυξε το δικό της LLM και μια εφαρμογή τύπου ChatGPT για ερωτήσεις – με μια πολύ μικρότερη επένδυση από εκείνη των παρόμοιων συστημάτων που κατασκευάστηκαν από αμερικανικές και ευρωπαϊκές εταιρείες. Η προσέγγιση της DeepSeek ανοίγει ένα παράθυρο στην ανάπτυξη LLM για μικρότερες οργανώσεις που δεν έχουν δισεκατομμύρια για να δαπανήσουν. Πράγματι, η ημέρα μπορεί να μην είναι μακριά όταν οι περισσότερες μικρές οργανώσεις θα μπορέσουν να αναπτύξουν τα δικά τους LLMs για να εξυπηρετήσουν τις δικές τους συγκεκριμένες ανάγκες, που συνήθως παρέχουν μια πιο αποτελεσματική λύση από τα γενικά LLMs όπως το ChatGPT.

Ενώ η συζήτηση παραμένει για το πραγματικό κόστος της DeepSeek, δεν είναι απλά το κόστος που τη διακρίνει και από παρόμοια μοντέλα: Είναι το γεγονός ότι βασίστηκε σε λιγότερο προηγμένα chip και μια πιο εστιασμένη προσέγγιση στην εκπαίδευση. Ως κινεζική εταιρεία που υπόκειται σε αμερικανικές εξαγωγικές περιορισμούς, η DeepSeek δεν μπορούσε να έχει πρόσβαση στα προηγμένα chip Nvidia που χρησιμοποιούνται γενικά για την επεξεργασία των μεγάλων μοντέλων και ήταν因此 αναγκασμένη να χρησιμοποιήσει λιγότερο ισχυρά chip Nvidia H-800, τα οποία δεν μπορούν να επεξεργαστούν δεδομένα τόσο γρήγορα ή αποτελεσματικά.

Για να αντισταθμίσει αυτήν την έλλειψη δύναμης, η DeepSeek ακολούθησε μια διαφορετική, πιο εστιασμένη και άμεση προσέγγιση στην ανάπτυξη του LLM. Αντί να ρίχνει βουνά δεδομένων σε ένα μοντέλο και να βασίζεται στην υπολογιστική δύναμη για να τα etiquetάρει και να τα εφαρμόσει, η DeepSeek στενεύτηκε την εκπαίδευση, χρησιμοποιώντας μια μικρή ποσότητα υψηλής ποιότητας “cold-start” δεδομένων και εφαρμόζοντας IRL (επαναληπτική ενισχυτική μάθηση, με το αλγόριθμο να εφαρμόζει δεδομένα σε διαφορετικές σκηνές και να μαθαίνει από αυτά). Αυτή η εστιασμένη προσέγγιση επιτρέπει στο μοντέλο να μαθαίνει γρηγορότερα, με λιγότερα λάθη και λιγότερη σπατάλη υπολογιστικής δύναμης.

Παρόμοια με το πώς οι γονείς μπορεί να οδηγήσουν τις συγκεκριμένες κινήσεις ενός μωρού, βοηθώντας το να γυρίσει με επιτυχία για πρώτη φορά – αντί να αφήσουν το μωρό να το καταλάβει μόνο του, ή να διδάξουν το μωρό μια ευρύτερη ποικιλία κινήσεων που θα μπορούσαν θεωρητικά να βοηθήσουν στο γύρισμα – οι επιστήμονες δεδομένων που εκπαιδεύουν αυτά τα πιο εστιασμένα μοντέλα AI εστιάζουν σε αυτό που είναι πιο απαραίτητο για συγκεκριμένες εργασίες και αποτελέσματα. Τέτοια μοντέλα πιθανότατα δεν έχουν τόσο ευρύ πεδίο εφαρμογής όσο τα μεγαλύτερα LLMs όπως το ChatGPT, αλλά μπορούν να βασιστούν για συγκεκριμένες εφαρμογές και να τις εκτελέσουν με ακρίβεια και αποτελεσματικότητα. Ακόμη και οι κριτικοί της DeepSeek παραδέχονται ότι η ροημένη προσέγγισή της στην ανάπτυξη αυξάνει σημαντικά την αποτελεσματικότητα, επιτρέποντάς της να κάνει περισσότερα με πολύ λιγότερα.

Αυτή η προσέγγιση είναι για να δώσουμε στο AI τις καλύτερες εισόδους ώστε να φτάσει στα ορόσημά του με τον πιο έξυπνο και αποτελεσματικό τρόπο, και μπορεί να είναι πολύτιμη για οποιαδήποτε οργάνωση που θέλει να αναπτύξει ένα LLM για τις συγκεκριμένες ανάγκες και εργασίες της. Τέτοια προσέγγιση είναι ολοένα και πιο πολύτιμη για μικρές επιχειρήσεις και οργανισμούς. Ο πρώτος βήμα είναι να ξεκινήσουμε με τα σωστά δεδομένα. Για παράδειγμα, μια εταιρεία που θέλει να χρησιμοποιήσει το AI για να βοηθήσει τις πωλήσεις και την marketing ομάδες της πρέπει να εκπαιδεύσει το μοντέλο της σε ένα προσεκτικά επιλεγμένο σύνολο δεδομένων που εστιάζει στις πωλήσεις συζητήσεις, στρατηγικές και μετρήσεις. Αυτό giữει το μοντέλο από το να σπαταλήσει χρόνο και υπολογιστική δύναμη σε άσχετα δεδομένα. Επιπλέον, η εκπαίδευση πρέπει να δοθεί σε στάδια, εξασφαλίζοντας ότι το μοντέλο κυριαρχεί σε κάθε εργασία ή έννοια πριν προχωρήσει στο επόμενο.

Αυτό, επίσης, έχει παραλληλισμούς με την ανατροφή ενός μωρού, όπως έχω μάθει από τότε που έγινα μητέρα πριν από quelques μήνες. Σε cả τις περιπτώσεις, μια καθοδηγούμενη, βήμα-προς-βήμα προσέγγιση αποφεύγει την σπατάλη πόρων και μειώνει την τριβή. Τέλος, αυτή η προσέγγιση και με τα ανθρώπινα μωρά και τα μοντέλα AI οδηγεί σε επαναληπτική βελτίωση. Όσο το μωρό μεγαλώνει, ή το μοντέλο μαθαίνει περισσότερα, οι ικανότητές του βελτιώνονται. Αυτό σημαίνει ότι τα μοντέλα μπορούν να βελτιωθούν και να αναπτυχθούν για να χειριστούν καλύτερα τις πραγματικές καταστάσεις.

Αυτή η προσέγγιση giữει τα κόστη χαμηλά, αποτρέποντας τα προγράμματα AI από το να γίνουν μια σπατάλη πόρων, καθιστώντας τα πιο προσιτά για μικρότερες ομάδες και οργανισμούς. Επίσης, οδηγεί σε καλύτερη απόδοση των μοντέλων AI πιο γρήγορα· και, επειδή τα μοντέλα δεν είναι υπερφορτωμένα με περιττά δεδομένα, μπορούν επίσης να προσαρμοστούν για να προσαρμοστούν σε νέες πληροφορίες και αλλαγές στις επιχειρηματικές ανάγκες – που είναι κρίσιμες σε ανταγωνιστικές αγορές.

Η άφιξη της DeepSeek και του κόσμου του φθηνότερου, πιο αποτελεσματικού AI – αν και αρχικά εξαπλώθηκε πανδημία στο κόσμο του AI και τις αγορές μετοχών – είναι συνολικά μια θετική εξέλιξη για τον κλάδο του AI. Η μεγαλύτερη αποτελεσματικότητα και τα χαμηλότερα κόστη του AI, τουλάχιστον για ορισμένες εστιασμένες εφαρμογές, θα οδηγήσουν τελικά σε περισσότερη χρήση του AI γενικά, που ωθεί την ανάπτυξη για όλους, από τους développers έως τους κατασκευαστές chip και τους τελικούς χρήστες. Πράγματι, η DeepSeek εικονογραφεί το παράδοξο Jevons – όπου μεγαλύτερη αποτελεσματικότητα θα οδηγήσει πιθανότατα σε περισσότερη χρήση ενός πόρων, όχι λιγότερη. Όσο αυτή η τάση φαίνεται να συνεχίζεται, οι μικρές επιχειρήσεις που εστιάζουν στην χρήση του AI για να καλύψουν τις συγκεκριμένες ανάγκες τους θα είναι επίσης καλύτερα τοποθετημένες για ανάπτυξη και επιτυχία.

Ο Stav Levi-Neumark είναι ο CEO & Co-founder της Alta και ειδικός σε διαχείριση προϊόντων και αύξηση εσόδων. Προηγουμένως, ήταν ένας από τους πρώτους υπαλλήλους στη Monday.com, όπου βοήθησε στην ανάπτυξη του "BigBrain", eines εσωτερικού εργαλείου BI που χρησιμοποιείται για τις ημερήσιες επιχειρησιακές λειτουργίες της εταιρείας. Ο Stav κατέχει πτυχίο BS.c σε επιστήμη υπολογιστών και στατιστική από το Εβραϊκό Πανεπιστήμιο της Ιερουσαλήμ.

Γνωστοποίηση διαφημιζόμενων: Το Unite.AI δεσμεύεται σε αυστηρά συντακτικά πρότυπα για την παροχή ακριβών πληροφοριών και ειδήσεων στους αναγνώστες μας. Ενδέχεται να λάβουμε αποζημίωση όταν κάνετε κλικ σε συνδέσμους προς προϊόντα που έχουμε αξιολογήσει.