Τεχνητή νοημοσύνη
Stability AI Launches StableLM: Open Source ChatGPT Alternatives

Stability AI, ο δημιουργός του διάσημου λογισμικού δημιουργίας εικόνων Stable Diffusion, έχει παρουσιάσει μια συλλογή από ανοικτού κώδικα εργαλεία μοντέλων γλώσσας, συμβάλλοντας στην επέκταση της βιομηχανίας των μεγάλων μοντέλων γλώσσας (LLM). Αυτή η νέα προσθήκη προσφέρει μια βιώσιμη εναλλακτική λύση στο ChatGPT της OpenAI, η οποία μπορεί να ωφελήσει μια βιομηχανία που γίνεται ανήσυχη για την OpenAI και τον κύριο επενδυτή της Microsoft να γίνουν πολύ μονοπωλιακές.
Οι αλφα εκδόσεις της σουίτας StableLM, με μοντέλα που διαθέτουν 3 δισεκατομμύρια και 7 δισεκατομμύρια παραμέτρους, είναι τώρα διαθέσιμες στο κοινό. Μοντέλα με 15 δισεκατομμύρια, 30 δισεκατομμύρια και 65 δισεκατομμύρια παραμέτρους είναι目前 υπό ανάπτυξη, ενώ ένα μοντέλο με 175 δισεκατομμύρια παραμέτρους προγραμματίζεται για το μέλλον.
Συγκριτικά, το GPT-4 της OpenAI διαθέτει μια εκτιμώμενη 1 τρισεκατομμύριο παραμέτρους, που είναι έξι φορές περισσότερες από το GPT-3.尽管 αυτό, η Stability AI τόνισε ότι η μέτρηση των παραμέτρων μπορεί να μην είναι ένας ακριβής δείκτης της αποτελεσματικότητας των LLM.
“Το StableLM εκπαιδεύεται σε ένα νέο πειραματικό σύνολο δεδομένων βασισμένο στο The Pile, αλλά τρεις φορές μεγαλύτερο, που περιέχει 1,5 τρισεκατομμύρια tokens περιεχομένου. Η πλούσια αυτή βάση δεδομένων επιτρέπει στο StableLM να παρουσιάζει εξαιρετικά υψηλή απόδοση σε συνομιλίες και εργασίες κωδικοποίησης, ακόμη και με τις μικρότερες 3 έως 7 δισεκατομμύρια παραμέτρους.”
Η ανθεκτικότητα των μοντέλων StableLM παραμένει να δειχθεί. Η ομάδα της Stability AI έχει δεσμευτεί να δημοσιεύσει περισσότερες πληροφορίες σχετικά με τις ικανότητες των LLMs στη σελίδα τους στο GitHub, συμπεριλαμβανομένων ορισμών μοντέλων και παραμέτρων εκπαίδευσης. Η εμφάνιση ενός ισχυρού, ανοικτού κώδικα εναλλακτικού του ChatGPT της OpenAI καλωσορίζεται από τους meisten ειδικούς της βιομηχανίας.
Σοφιστικέ και προηγμένα εργαλεία τρίτων, όπως το BabyAGI και το AutoGPT, όπως αναφέρθηκε πρόσφατα, ενσωματώνουν αναδρομή σε εφαρμογές AI, που σημαίνει ότι μπορούν να δημιουργούν και να τροποποιούν τις δικές τους προτροπές για αναδρομικές περιπτώσεις με βάση τις νέες πληροφορίες.
Η ενσωμάτωση ανοικτών μοντέλων στο μείγμα μπορεί να ωφελήσει τους χρήστες της βιομηχανίας που προτιμούν ή μπορεί να μην είναι σε θέση να πληρώσουν τις χρεώσεις πρόσβασης της OpenAI. Οι ενδιαφερόμενοι μπορούν να δοκιμάσουν μια ζωντανή διεπαφή για το μοντέλο StableLM 7 δισεκατομμυρίων παραμέτρων που φιλοξενείται από το HuggingFace.
Παραμένει να δειχθεί ποια εταιρεία θα κάνει το επόμενο βήμα για να προσφέρει παρόμοια μοντέλα LLM.












