Connect with us

Τεχνητή νοημοσύνη

Open-Source AI Strikes Back With Meta’s Llama 4

mm

Στις τελευταίες quelques χρόνια, ο κόσμος του AI έχει μετατοπιστεί από μια κουλτούρα ανοιχτής συνεργασίας σε μια που κυριαρχείται από στενά φυλαγμένα ιδιόκτητα συστήματα. Το OpenAI – μια εταιρεία που ιδρύθηκε κυριολεκτικά με το “ανοιχτό” στο όνομά της – άλλαξε την πολιτική του για τη διατήρηση των πιο ισχυρών μοντέλων μυστικών μετά το 2019. Ανταγωνιστές όπως το Anthropic και το Google построили επίσης προηγμένα μοντέλα AI πίσω από τοίχους API, που είναι προσβάσιμα μόνο με τους δικούς τους όρους. Αυτή η κλειστή προσέγγιση δικαιολογούνταν εν μέρει από λόγους ασφαλείας και επιχειρηματικών συμφεροντων, αλλά άφησε πολλούς στην κοινότητα να θρηνούν την απώλεια του πνεύματος της ανοιχτής πηγής.

Τώρα, αυτό το πνεύμα επιστρέφει. Τα νέα μοντέλα Llama 4 της Meta σηματοδοτούν μια τολμηρή προσπάθεια να αναβιώσουν την ανοιχτή πηγή AI στα υψηλότερα επίπεδα – και ακόμη και παραδοσιακά φρουρούμενοι παίκτες λαμβάνουν σημειώσεις. Ο CEO του OpenAI, Sam Altman, πρόσφατα παραδέχτηκε ότι η εταιρεία ήταν “στη λάθος πλευρά της ιστορίας” σχετικά με τα ανοιχτά μοντέλα και ανακοίνωσε σχέδια για ένα “ισχυρό νέο ανοιχτό-βαρύ” μοντέλο GPT-4. Σε σύντομη, η ανοιχτή πηγή AI ανταποδίδει, και η σημασία και η αξία του “ανοιχτού” εξελίσσονται.

(Πηγή: Meta)

Llama 4: Η ανοιχτή πρόκληση της Meta για GPT-4o, Claude και Gemini

Η Meta παρουσίασε το Llama 4 ως άλλη μια άμεση πρόκληση για τα νέα μοντέλα από τους βαρύτομους του AI, τοποθετώντας το ως ανοιχτό-βαρύ εναλλακτικό. Το Llama 4 έρχεται σε δύο γεύσεις που είναι διαθέσιμες σήμερα – Llama 4 Scout και Llama 4 Maverick – με εντυπωσιακά τεχνικά χαρακτηριστικά. Και τα δύο είναι μοντέλα mixture-of-experts (MoE) που ενεργοποιούν μόνο ένα τμήμα των παραμέτρων τους ανά ερώτημα, επιτρέποντας τη μαζική συνολική μέγεθος χωρίς να καταστρέφουν τους χρόνους εκτέλεσης. Ο Scout και ο Maverick κατέχουν από 17 δισεκατομμύρια “ενεργές” παραμέτρους (το μέρος που λειτουργεί σε οποιαδήποτε δεδομένη είσοδο), αλλά χάρη στο MoE, ο Scout διασκορπίζει αυτές τις παραμέτρους σε 16 εμπειρογνώμονες (109 δισεκατομμύρια παραμέτρους συνολικά) και ο Maverick σε 128 εμπειρογνώμονες (400 δισεκατομμύρια συνολικά). Το αποτέλεσμα: τα μοντέλα Llama 4 προσφέρουν φORMidable απόδοση – και το κάνουν με μοναδικά πλεονεκτήματα που ακόμη και κάποια κλειστά μοντέλα δεν έχουν.

Για παράδειγμα, το Llama 4 Scout διαθέτει ένα ηγετικό 10 εκατομμύρια token παράθυρο контекστο, πολλαπλάσιο των περισσότερων αντιπάλων. Αυτό σημαίνει ότι μπορεί να καταναλώσει και να συλλογιστεί πάνω από πραγματικά τεράστια έγγραφα ή βάσεις κώδικα σε μια φορά.尽管 το μέγεθός του, ο Scout είναι αρκετά αποτελεσματικός για να τρέξει σε ένα seul H100 GPU όταν είναι υψηλά quantized, δείχνοντας ότι οι dévelopπεurs δεν θα χρειαστεί να έχουν einen siêuυπολογιστή για να πειραματιστούν με αυτό.

Εν τω μεταξύ, το Llama 4 Maverick είναι ρυθμισμένο για μέγιστη δύναμη. Τα πρώτα tests δείχνουν ότι ο Maverick ταιριάζει ή υπερβαίνει τα κορυφαία κλειστά μοντέλα σε εργασίες reasoning, κωδικοποίησης και οράσεως. Στην πραγματικότητα, η Meta ήδη προβάλλει ένα ακόμη μεγαλύτερο αδελφό, Llama 4 Behemoth, που είναι ακόμη σε εκπαίδευση, το οποίο εσωτερικά “υπερβαίνει το GPT-4.5, το Claude 3.7 Sonnet και το Gemini 2.0 Pro σε διάφορα STEM benchmarks.” Το μήνυμα είναι σαφές: τα ανοιχτά μοντέλα δεν είναι πλέον δεύτερης κατηγορίας· το Llama 4 στοχεύει στην κατάκτηση του state-of-the-art καθεστώτος.

Ιδιαίτερα σημαντικό, η Meta έχει κάνει το Llama 4 αμέσως διαθέσιμο για λήψη και χρήση. Οι dévelopπεurs μπορούν να λάβουν τον Scout και τον Maverick από τον επίσημο ιστότοπο ή Hugging Face υπό την άδεια Llama 4 Community. Αυτό σημαίνει ότι ο καθένας – από έναν hacker garage έως μια εταιρεία Fortune 500 – μπορεί να μπει στο πνεύμονα, να tinh chỉnh το μοντέλο σύμφωνα με τις ανάγκες του και να το αναπτύξει στο δικό του υλικό ή cloud. Αυτό είναι μια σαφής αντίθεση με τις ιδιόκτητες προσφορές όπως το GPT-4o της OpenAI ή το Claude 3.7 της Anthropic, τα οποία παρέχονται μέσω paid API χωρίς πρόσβαση στα υποκείμενα βάρη.

Η Meta τονίζει ότι η ανοιχτή πηγή του Llama 4 είναι για την ενδυνάμωση των χρηστών: “Μοιραζόμαστε τα πρώτα μοντέλα στη στάνη Llama 4, τα οποία θα επιτρέψουν στους ανθρώπους να δημιουργήσουν πιο προσωποποιημένες πολυμεσικές εμπειρίες.” Με άλλα λόγια, το Llama 4 είναι ένα εργαλείο που προορίζεται να βρίσκεται στα χέρια των développeurs και ερευνητών σε όλο τον κόσμο. Μέσω της δημοσίευσης μοντέλων που μπορούν να ανταγωνιστούν τα μοντέλα GPT-4 και Claude σε ικανότητες, η Meta αναβίωσε την έννοια ότι η κορυφαία AI δεν πρέπει να ζει πίσω από έναν τοίχο πληρωμής.

(Πηγή: Meta)

Αυθεντικός ιδεαλισμός ή στρατηγική κίνηση;

Η Meta παρουσιάζει το Llama 4 με μεγαλοπρεπείς, σχεδόν αλτρουιστικές όρους. “Το ανοιχτό μοντέλο AI μας, Llama, έχει κατεβαστεί περισσότερες από ένα δισεκατομμύριο φορές,” ο CEO Mark Zuckerberg ανακοίνωσε πρόσφατα, προσθέτοντας ότι “η ανοιχτή πηγή των μοντέλων AI είναι απαραίτητη για να διασφαλιστεί ότι οι άνθρωποι παντού έχουν πρόσβαση στα οφέλη της AI.” Αυτή η παρουσίαση ζωγραφίζει τη Meta ως τον φανό της δημοκρατίας AI – μια εταιρεία που είναι πρόθυμη να μοιραστεί τα κορυφαία μοντέλα της για το μεγαλύτερο καλό. Και στην πραγματικότητα, η δημοτικότητα της οικογένειας Llama υποστηρίζει αυτό: τα μοντέλα έχουν κατεβαστεί σε εκπληκτική κλίμακα (πηδώντας από 650 εκατομμύρια σε 1 δισεκατομμύριο συνολικές λήψεις σε λίγους μήνες), και ήδη χρησιμοποιούνται σε παραγωγή από εταιρείες όπως η Spotify, η AT&T και η DoorDash.

Η Meta υπερηφανεύεται ότι οι développeurs εκτιμούν την “διαφάνεια, την προσαρμογή και την ασφάλεια” του να έχουν ανοιχτά μοντέλα που μπορούν να τρέξουν οι ίδιοι, τα οποία “βοηθούν να φτάσουν σε νέα επίπεδα δημιουργικότητας και καινοτομίας,” σε σύγκριση με τα μαύρα κουτιά API. Σε principio, αυτό ακούγεται σαν το παλιό ανοιχτό πνεύμα λογισμικού (σκέψου Linux ή Apache) που εφαρμόζεται στην AI – μια αδιαμφισβήτητη νίκη για την κοινότητα.

Ωστόσο, δεν μπορείς να αγνοήσεις τον στρατηγικό υπολογισμό πίσω από αυτήν την ανοιχτή πηγή. Η Meta δεν είναι μια φιλανθρωπική οργάνωση, και “ανοιχτή πηγή” σε αυτό το контекστό έρχεται με επιφυλάξεις. Συγκεκριμένα, το Llama 4 εκδίδεται υπό μια đặcική άδεια κοινότητας, όχι μια τυπική permissive άδεια – έτσι ενώ τα μοντέλα βάρος είναι δωρεάν για χρήση, υπάρχουν περιορισμοί (για παράδειγμα, ορισμένες υψηλές πόρων χρήσεις μπορεί να απαιτούν άδεια, και η άδεια είναι “ιδιόκτητη” στο ότι είναι κατασκευασμένη από τη Meta). Αυτό δεν είναι η Open Source Initiative (OSI) εγκεκριμένη ορισμός της ανοιχτής πηγής, το οποίο έχει οδηγήσει ορισμένους κριτικούς να υποστηρίξουν ότι οι εταιρείες χρησιμοποιούν λανθασμένα τον όρο.

Στην πράξη, η προσέγγιση της Meta περιγράφεται συχνά ως “ανοιχτό-βαρύ” ή “πηγή-διαθέσιμη” AI: ο κώδικας και τα βάρη είναι ανοιχτά, αλλά η Meta διατηρεί κάποιο έλεγχο και δεν αποκαλύπτει όλα (π.χ. δεδομένα εκπαίδευσης). Αυτό δεν μειώνει τη χρησιμότητα για τους χρήστες, αλλά δείχνει ότι η Meta είναι στρατηγικά ανοιχτή – κρατώντας μόνο αρκετά χαλινάρια για να προστατεύσει τον εαυτό της (και vielleicht την конкурентική της πλευρά). Πολλές εταιρείες κολλάνε ετικέτες “ανοιχτής πηγής” σε μοντέλα AI ενώ κρατούν κρυφά σημαντικά λεπτομέρειες, υπονομεύοντας το αληθινό πνεύμα της ανοιχτής πηγής.

Γιατί θα άνοιγε η Meta; Το ανταγωνιστικό τοπίο προσφέρει ενδείξεις. Η έκδοση ισχυρών μοντέλων δωρεάν μπορεί να χτίσει γρήγορα μια ευρεία βάση développeurs και επιχειρηματικών χρηστών – Mistral AI, μια γαλλική εταιρεία, έκανε ακριβώς αυτό με τα πρώιμα ανοιχτά μοντέλα της για να κερδίσει αξιοπιστία ως κορυφαίο εργαστήριο.

Βάζοντας την αγορά με το Llama, η Meta διασφαλίζει ότι η τεχνολογία της γίνεται θεμελιώδης στο AI ecosystem, το οποίο μπορεί να αποφέρει μακροπρόθεσμα οφέλη. Είναι μια κλασική στρατηγική: αν όλοι χρησιμοποιούν το “ανοιχτό” μοντέλο σας, έμμεσα ορίζετε πρότυπα και vielleicht οδηγείτε τους ανθρώπους προς τις πλατφόρμες σας (για παράδειγμα, τα προϊόντα AI βοηθού της Meta χρησιμοποιούν το Llama. Υπάρχει επίσης ένα στοιχείο PR και θέση. Η Meta παίζει το ρόλο του ευεργέτη καινοτόμου, ειδικά σε σύγκριση με το OpenAI – το οποίο έχει αντιμετωπίσει κριτική για την κλειστή προσέγγισή του. Στην πραγματικότητα, η αλλαγή καρδιάς του OpenAI σχετικά με τα ανοιχτά μοντέλα υπογραμμίζει kısmιαώς πόσο αποτελεσματική ήταν η κίνηση της Meta.

Μετά το πρωτοποριακό ανοιχτό μοντέλο DeepSeek-R1 που εμφανίστηκε τον Ιανουάριο και ξεπέρασε τα προηγούμενα μοντέλα, ο Altman έδειξε ότι το OpenAI δεν ήθελε να μείνει στην “λάθος πλευρά της ιστορίας”. Τώρα το OpenAI υποσχέθηκε ένα ανοιχτό μοντέλο με ισχυρές ικανότητες reasoning στο μέλλον, σηματοδοτώντας μια αλλαγή στάσης, είναι δύσκολο να μη δεις την επίδραση της Meta σε αυτήν την αλλαγή. Η ανοιχτή πηγή της Meta είναι και αυθεντική και στρατηγική: αυθεντικά διευρύνει την πρόσβαση στην AI, αλλά είναι επίσης ένα έξυπνο παιχνίδι για να ξεπεράσει τους αντιπάλους και να διαμορφώσει το μέλλον της αγοράς με τους δικούς της όρους.

Επιπτώσεις για τους développeurs, τις επιχειρήσεις και το μέλλον της AI

Για τους développeurs, η αναβίωση των ανοιχτών μοντέλων όπως το Llama 4 είναι ένα αναπνευστικό άνεμα. Αντί να είναι κλειδωμένοι σε ένα seul εκосύστημα και χρεώσεις, τώρα έχουν την επιλογή να τρέξουν ισχυρή AI στο δικό τους υπολογιστικό σύστημα ή να την προσαρμόσουν ελεύθερα.

Αυτό είναι ένα τεράστιο όφελος για τις επιχειρήσεις σε ευαίσθητες βιομηχανίες – σκέψου τη finance, την υγεία ή την κυβέρνηση – που είναι διστακτικές να ταΐσουν εμπιστευτικά δεδομένα σε ένα μαύρο κουτί. Με το Llama 4, μια τράπεζα ή ένα νοσοκομείο θα μπορούσε να αναπτύξει ένα state-of-the-art γλωσσικό μοντέλο πίσω από το δικό του τείχος, να το tinh chỉnh σε ιδιωτικά δεδομένα, χωρίς να μοιράζεται ένα token με ένα εξωτερικό όν. Υπάρχει επίσης ένα πλεονέκτημα κόστους. Ενώ οι χρεώσεις API για τα κορυφαία μοντέλα μπορούν να εκτοξευτούν, ένα ανοιχτό μοντέλο δεν έχει χρέωση usage – πληρώνεις μόνο για την υπολογιστική δύναμη για να το τρέξεις. Οι επιχειρήσεις που αυξάνουν βαριά AI εργασιές στέκονται να σώσουν σημαντικά επιλέγοντας μια ανοιχτή λύση που μπορούν να κλιμακωθούν εσωτερικά.

Δεν είναι έκπληξη, λοιπόν, που βλέπουμε περισσότερο ενδιαφέρον για ανοιχτά μοντέλα από τις επιχειρήσεις· πολλές έχουν αρχίσει να συνειδητοποιούν ότι ο έλεγχος και η ασφάλεια της ανοιχτής πηγής AI ταιριάζουν καλύτερα με τις ανάγκες τους από τις κλειστές υπηρεσίες.

Οι développeurs, επίσης, αποκομίζουν οφέλη στην καινοτομία. Με πρόσβαση στα εσωτερικά του μοντέλου, μπορούν να tinh chỉnh και να βελτιώσουν την AI για νιχες περιοχές (νόμος, βιοτεχνολογία, περιφερειακές γλώσσες – ονομάστε τις) με τρόπους που ένα κλειστό API μπορεί να μην κατεβεί ποτέ. Η έκρηξη των community-driven projects γύρω από τα προηγούμενα μοντέλα Llama– από chatbots tinh chỉnh σε ιατρικές γνώσεις έως hobbyist smartphone apps που τρέχουν miniature εκδόσεις – απέδειξε πώς τα ανοιχτά μοντέλα μπορούν να δημοκρατίσουν την πειραματική.

Ωστόσο, η αναβίωση των ανοιχτών μοντέλων cũng ανεβάζει δύσκολα ερωτήματα. Συντελείται真的 “δημοκρατία” αν μόνο εκείνοι με σημαντικές υπολογιστικές πόρους μπορούν να τρέξουν ένα μοντέλο 400B παραμέτρων; Ενώ το Llama 4 Scout και Maverick μειώνουν την υλική μπάρα σε σύγκριση με τα μονόλιθα μοντέλα, είναι ακόμη βαρέα – ένα σημείο που δεν χάνεται σε ορισμένους développeurs των οποίων οι υπολογιστές δεν μπορούν να το χειριστούν χωρίς cloud βοήθεια.

Η ελπίδα είναι ότι τεχνικές όπως η συμπίεση μοντέλων, η απόσταξη ή οι μικρότεροι εμπειρογνώμονες εκδοχές θα διαβρώσουν την δύναμη του Llama 4 σε πιο προσιτά μεγέθη. Ένα άλλο πρόβλημα είναι η κακοποίηση. Το OpenAI και άλλοι έχουν υποστηρίξει ότι η έκδοση ισχυρών μοντέλων ανοιχτά θα μπορούσε να ενεργοποιήσει κακόβουλους actors (για τη δημιουργία ψευδών πληροφοριών, κώδικα malware κ.λπ.).

Αυτά τα προβλήματα παραμένουν: ένα ανοιχτό μοντέλο Claude ή GPT θα μπορούσε να κακοποιηθεί χωρίς τα φίλτρα ασφαλείας που οι εταιρείες επιβάλλουν στις API τους. Από την άλλη πλευρά, οι υποστηρικτές υποστηρίζουν ότι η ανοιχτή πηγή επιτρέπει στην κοινότητα να αναγνωρίσει και να διορθώσει προβλήματα, καθιστώντας τα μοντέλα πιο robust και διαφανή με τον καιρό από οποιοδήποτε μυστικό σύστημα. Υπάρχει απόδειξη ότι οι κοινότητες ανοιχτών μοντέλων λαμβάνουν την ασφάλεια σοβαρά, αναπτύσσοντας τα δικά τους φραγμούς και μοιράζοντας τις mejores πρακτικές – αλλά είναι μια συνεχής τάση.

Τι γίνεται όλο και πιο σαφές είναι ότι προχωρούμε προς ένα υβριδικό τοπίο AI όπου ανοιχτά και κλειστά μοντέλα συνυπάρχουν, με το καθένα να επηρεάζει το άλλο. Κλειστοί παρόχοι όπως το OpenAI, Anthropic και Google vẫn διατηρούν μια πλευρά σε απόλυτη απόδοση – για τώρα. Στην πραγματικότητα, μέχρι τα τέλη του 2024, η έρευνα δείχνει ότι τα ανοιχτά μοντέλα ήταν περίπου ένα χρόνο πίσω από τα καλύτερα κλειστά μοντέλα σε ικανότητες. Αλλά αυτή η διαφορά κλείνει γρήγορα.

Στη σημερινή αγορά, “ανοιχτή πηγή AI” δεν σημαίνει πλέον μόνο ερασιτεχνικά projects ή παλαιότερα μοντέλα – είναι τώρα στο κέντρο της στρατηγικής AI για γίγαντες τεχνολογίας και startups. Η εκτόξευση του Llama 4 της Meta είναι μια ισχυρή υπενθύμιση της εξελισσόμενης αξίας της ανοιχτής πηγής. Είναι ταυτόχρονα μια φιλοσοφική στάση για τη δημοκρατία της τεχνολογίας και μια τακτική κίνηση σε μια υψηλού επιβίβασης βιομηχανική μάχη. Για τους développeurs και τις επιχειρήσεις, ανοίγει νέες πόρτες στην καινοτομία και την αυτονομία, ακόμη και καθώς περιπλέκει τις αποφάσεις με νέες αντιζηλίες. Και για το ευρύτερο ecosystem, ανεβάζει την ελπίδα ότι τα οφέλη της AI δεν θα κλειστούν στα χέρια quelques εταιρειών – αν το ανοιχτό πνεύμα μπορεί να διατηρήσει την υπεροχή του.

Ο Alex McFarland είναι δημοσιογράφος και συγγραφέας του AI που εξερευνά τις τελευταίες εξελίξεις στην τεχνητή νοημοσύνη. Έχει συνεργαστεί με πολλές startups και εκδόσεις του AI σε όλο τον κόσμο.