Συνδεθείτε μαζί μας

Το AI Mirage της Κίνας: Πώς το «ανοιχτό λογισμικό» κρύβει ό,τι έχει μεγαλύτερη σημασία

Ηγέτες της σκέψης

Το AI Mirage της Κίνας: Πώς το «ανοιχτό λογισμικό» κρύβει ό,τι έχει μεγαλύτερη σημασία

mm

Με τις μεγάλες εταιρείες τεχνολογίας όπως η Google, η Microsoft και η Meta να ανταγωνίζονται για να κυριαρχήσουν στην αγορά της τεχνητής νοημοσύνης, οι κινεζικές High Flyer, Baidu, Moonshot και Alibaba έχουν γίνει πρωτοσέλιδα για την κυκλοφορία τους. DeepSeekERNIE 4.5Κύμη Κ2, να Qwen3 μεγάλα γλωσσικά μοντέλα, αντίστοιχα, ως ανοιχτού κώδικα. Αυτή η μετατόπιση από την κυκλοφορία προστατευμένων, ιδιόκτητων μοντέλων GenAI έχει εκληφθεί ως ένδειξη ότι η βιομηχανία Τεχνητής Νοημοσύνης της Κίνας αγκαλιάζει τη δύναμη του ανοιχτού κώδικα για να εκδημοκρατίσει την ανάπτυξη της Τεχνητής Νοημοσύνης και να ενισχύσει την καινοτομία.

Όπως πολλοί παίκτες που διαφημίζουν τις προσφορές τους ως ανοιχτού κώδικα και μάλιστα το αναφέρουν και στα ονόματα των εταιρειών τους, ωστόσο, οι High Flyer, Baidu και Moonshot δεν έχουν στην πραγματικότητα μοιραστεί κρίσιμα κομμάτια όπως σύνολα δεδομένων που βρίσκονται στην καρδιά των μοντέλων τους. Καθώς αυτά τα μεγάλα μοντέλα επιδιώκουν να γίνουν προϊόντα στα οποία βασίζονται οι προγραμματιστές, η διαφάνεια του πραγματικού ανοιχτού κώδικα που μπορεί να δοκιμαστεί, να διερευνηθεί και να επαναληφθεί είναι κρίσιμη για τη δημιουργία αμερόληπτης, ηθικής και ωφέλιμης τεχνολογίας στην οποία μπορούμε όλοι να εμπιστευτούμε. Όλα αυτά τα μοντέλα "ανοιχτού κώδικα" είναι στην πραγματικότητα "ανοιχτού βάρους", που σημαίνει ότι μπορούν να ληφθούν και να χρησιμοποιηθούν, αλλά δεν μπορούν να ελεγχθούν με κανέναν ουσιαστικό τρόπο χωρίς τα δεδομένα.

Όπως αρέσουν στους παίκτες των ΗΠΑ Ανοίξτε το AI και  Meta Παρόλο που φαίνεται να απομακρύνονται από το ανοιχτό λογισμικό, η ανοιχτή πρόσκληση της Baidu να αξιοποιήσει την ελεύθερα διαθέσιμη σουίτα μοντέλων ERNIE 4.5 μπορεί πράγματι να ωθήσει την καινοτομία και τη συνεργασία με προγραμματιστές που επιθυμούν να δημιουργήσουν μικρότερες, ισχυρές εφαρμογές. Ταυτόχρονα, η εταιρεία, η οποία είναι παρόμοια με την κινεζική Google, έχει δώσει στον εαυτό της ένα ανταγωνιστικό πλεονέκτημα ενθαρρύνοντας την υιοθέτηση και εδραιώνοντας τα μοντέλα της στο αναπτυσσόμενο οικοσύστημα τεχνητής νοημοσύνης.

Το ίδιο μπορεί να ειπωθεί για το DeepSeek, το οικονομικό Kimi K2 και το ενημερωμένο Qwen3—το οποίο διαθέτει benchmarks που αμφισβητούν κλειστά μοντέλα όπως το Claude Opus 4 και το GPT-4o-0327.

Αυτοί οι παίκτες τεχνητής νοημοσύνης έχουν τοποθετηθεί καλά στην κούρσα για να γίνουν το μοντέλο αγοράς και η τελευταία καινοτόμος ενημέρωση του Qwen3 εμπνεύστηκε ακόμη και από τα σχόλια της κοινότητας ανοιχτού κώδικα.

Όπως πολλοί που διαφημίζουν το μεγάλο μοντέλο τεχνητής νοημοσύνης τους ως ανοιχτού κώδικα, ωστόσο, η κινεζική κοινότητα τεχνητής νοημοσύνης δεν μοιράζεται στην πραγματικότητα τα δεδομένα ή άλλα κρίσιμα κομμάτια των συστημάτων τεχνητής νοημοσύνης της. Αντίθετα, ζητά από τους παγκόσμιους προγραμματιστές να εμπιστευτούν τυφλά μοντέλα που δεν μπορούν πραγματικά να κατανοήσουν ή να διερευνήσουν.

Διεκδικώντας το μέλλον με μοντέλα τεχνητής νοημοσύνης ανοιχτού κώδικα για εμπορεύματα

Όταν το iPhone έκανε την εμφάνισή του στην αγορά το 2007, κάποιοι υπέθεσαν ότι ο Mac θα κυριαρχούσε στον κόσμο των smartphone με το iOS, αλλά... Η συμμετοχή σε ανοιχτό κώδικα είναι αναπόσπαστο κομμάτι για τις νεοσύστατες επιχειρήσεις, ενώ παράλληλα ώθησε την επιχειρηματική και οικονομική ανάπτυξη παγκοσμίως — και η Android, μια νεοσύστατη επιχείρηση που εξαγοράστηκε από την Google το 2005, ακολούθησε αυτό το μονοπάτι προς τη νίκη.

Κυκλοφορώντας λογισμικό ανοιχτού κώδικα που μπορούσε να προβληθεί, να τροποποιηθεί, να υιοθετηθεί και να κοινοποιηθεί, το Android κάλεσε ακαδημαϊκούς, προγραμματιστές, ακόμη και ανταγωνιστές να συνεργαστούν στο λογισμικό. Αυτό επιτάχυνε τη διαδικασία καινοτομίας, εκδημοκρατοποίησε το πεδίο ανταγωνισμού και, τελικά, μείωσε τις τιμές. Το Android κυκλοφόρησε στην αγορά ένα χρόνο μετά το πρώτο iPhone και στις αρχές του τρέχοντος έτους, κατείχε το 71.88% της παγκόσμιας αγοράς, έναντι 27.65% του iOS.

Σε μια τεχνολογική επανάσταση που φαινόταν να συμβαίνει εν μία νυκτί, τα smartphones έγιναν πανταχού παρόντα και, ακόμη και καθώς συνεχίζονται οι βελτιώσεις στο λογισμικό, το υλικό και το περιβάλλον εργασίας χρήστη, η βιομηχανία έχει ξεπεράσει κατά πολύ την προσπάθεια να φέρει επανάσταση στον τρόπο λειτουργίας των smartphones. Με τα κινητά τηλέφωνα πλέον να αποτελούν εμπόρευμα, η καινοτομία που υπάρχει σήμερα βρίσκεται στις εφαρμογές που εκτελούνται σε αυτά και, για να είναι ανταγωνιστικοί, οι πάροχοι smartphone πρέπει να διατηρούν ένα οικοσύστημα που προσκαλεί προγραμματιστές.

Λίγο πριν περάσουν τρία χρόνια από την κυκλοφορία του ChatGPT, η βιομηχανία τεχνητής νοημοσύνης βρίσκεται σε παρόμοιο γκρεμό. Κάθε παίκτης στην παγκόσμια βιομηχανία τεχνητής νοημοσύνης επιδιώκει τα μοντέλα του να γίνουν το επόμενο Android ή ακόμα και iOS, και με την ενσωμάτωση ανοιχτού κώδικα με τα μοντέλα DeepSeek, ERNIE 4.5 και Kimi K2, οι Κινέζοι καινοτόμοι επιδιώκουν να διεκδικήσουν την εύνοιά τους σε ένα αναπτυσσόμενο οικοσύστημα.

Ενώ αυτό θα μπορούσε να λειτουργήσει υπέρ τους, ωστόσο, δεν ενισχύει την πραγματική διαφάνεια του ανοιχτού κώδικα που ήταν απαραίτητη όχι μόνο για την καλλιέργεια της καινοτομίας, αλλά και για την καλλιέργεια καινοτομίας στην οποία μπορούμε να εμπιστευτούμε.

Τα δεδομένα είναι το κομμάτι που λείπει από τις περισσότερες τεχνητές νοημοσύνης ανοιχτού κώδικα

Με τα μοντέλα Τεχνητής Νοημοσύνης (ΤΝ) να είναι πολύ πιο περίπλοκα στη δημιουργία και την κοινοποίηση από το παραδοσιακό λογισμικό, η ανάγκη για πλήρως ανοιχτού κώδικα ΤΝ δεν είναι εύκολη υπόθεση. Αντί για έναν απλό πηγαίο κώδικα, τα συστήματα ΤΝ αποτελούνται από επτά συστατικά—συμπεριλαμβανομένου του πηγαίου κώδικα, των παραμέτρων του μοντέλου, του συνόλου δεδομένων, των υπερπαραμέτρων, του πηγαίου κώδικα εκπαίδευσης, της παραγωγής τυχαίων αριθμών και των πλαισίων λογισμικού.

Κάθε κομμάτι πρέπει να λειτουργεί αρμονικά ώστε ένα μοντέλο να προσφέρει τα επιθυμητά αποτελέσματα, πράγμα που σημαίνει ότι οι προγραμματιστές χρειάζονται πλήρη ορατότητα για να μοιράζονται, να τροποποιούν και να υιοθετούν ένα σύστημα και να κατανοούν τι συμβαίνει. Με την αναπαραγωγιμότητα να αποτελεί το θεμέλιο της επιστημονικής μεθόδου, ωστόσο, ο κλάδος της Τεχνητής Νοημοσύνης έχει... συνήθεια της χρήσης του όρου ανοιχτού κώδικα για να αναφερθούμε σε δωρεάν ή σε χαμηλή τιμή εκδόσεις που διατίθενται με πρόσβαση σε μερικά κομμάτια του παζλ.

Η Baidu, για παράδειγμα, διέθεσε δωρεάν δέκα μοντέλα ERNIE 4.5. Εκτός από την κοινοποίηση του μοντέλου και των παραμέτρων, η εταιρεία διέθεσε επίσης ανοιχτού κώδικα το ERNIEKit και τα κιτ εργαλείων ανάπτυξης FastDeploy. Αυτά επιτρέπουν στους προγραμματιστές να δημιουργούν ισχυρές εφαρμογές Τεχνητής Νοημοσύνης παρέχοντας δυνατότητες βιομηχανικού επιπέδου, ροές εργασίας εκπαίδευσης και συμπερασμάτων με αποδοτική χρήση πόρων και συμβατότητα πολλαπλών συσκευών.

Με άλλα λόγια, η Baidu έχει παράσχει στους προγραμματιστές συναρπαστικά εργαλεία που τους δίνουν τη δυνατότητα να απελευθερώσουν την καινοτομία πιο γρήγορα, κάτι που ελπίζουν ότι με τη σειρά του θα τους δελεάσει να επιλέξουν το ERNIE 4.5 έναντι του ανταγωνισμού.

Ωστόσο, οι προγραμματιστές που αξιοποιούν το ERNIE 4.5 καλούνται να εμπιστευτούν τυφλά το μοντέλο, επειδή η Baidu έχει κρατήσει πολλά κρυφά, συμπεριλαμβανομένων των συνόλων δεδομένων που ενημερώνουν και διδάσκουν τα μοντέλα της.

Η δύναμη των διαφανών μοντέλων τεχνητής νοημοσύνης ανοιχτού κώδικα

Ενώ κάθε κομμάτι του παζλ της Τεχνητής Νοημοσύνης είναι κρίσιμο για να λειτουργήσει ένα μοντέλο, Το 80% των έργων τεχνητής νοημοσύνης αποτυγχάνουν και τα δεδομένα βρίσκονται στην καρδιά του προβλήματοςΤα ανακριβή, ελλιπή και μεροληπτικά σύνολα δεδομένων οδηγούν σε μοντέλα που δεν συμπεριφέρονται προβλέψιμα ή όπως επιθυμείται.

The Πρόσφατα κυκλοφόρησε βίντεο από το μοιραίο τροχαίο ατύχημα ενός Tesla Full-Self-Driving (FSD) του 2023, για παράδειγμα, αποκάλυψε το χειρότερο σενάριο για το τι μπορεί να συμβεί όταν ένα σύνολο δεδομένων και ένα μοντέλο αποτυγχάνουν. Καθώς το Tesla Model Y έτρεχε σε έναν λαμπερό, δύοντα ήλιο, το μερικώς αυτοματοποιημένο σύστημα δεν μπορούσε να κατανοήσει ή να αντιδράσει κατάλληλα σε αυτό που έβλεπαν οι κάμερές του - ή δεν έβλεπαν. Ενώ τα αυτοκίνητα που οδηγούνταν από ανθρώπους επιβράδυναν και σταμάτησαν, η σύγχυση του FSD είχε ως αποτέλεσμα τον θάνατο μιας γυναίκας.

Αυτή η καταστροφική αποτυχία αντανακλούσε ατελή οπτικά δεδομένα, καθώς και την έλλειψη ενός μηχανισμού ασφαλείας που να αντιμετώπιζε τέτοια τυφλά σημεία. Όταν οι προγραμματιστές δεν έχουν εικόνα των δεδομένων τους, δεν μπορούν να δουν πώς αλληλεπιδρούν με το μοντέλο, πράγμα που σημαίνει ότι δεν μπορούν να εντοπίσουν τέτοια λάθη και να επαναλάβουν την εργασία για ισχυρή απόδοση.

Ακόμα πιο ανησυχητικό είναι ότι, χωρίς τα δεδομένα που τροφοδοτούν το μοντέλο, είναι αναγκασμένοι να το εμπιστεύονται τυφλά.

Όταν όμως τα σύνολα δεδομένων είναι ανοιχτού κώδικα, η κοινότητα της Τεχνητής Νοημοσύνης έχει αποδείξει ότι θα ξεριζώσει τα προβληματικά ζητήματα, όπως έκανε αποκαλύπτοντας... πάνω από 1,000 URL που περιέχουν επαληθευμένο υλικό σεξουαλικής κακοποίησης παιδιών στο LAION 5BΚαθώς το σύνολο δεδομένων που χρησιμοποιείται για μοντέλα δημιουργίας κειμένου σε εικόνα με τεχνητή νοημοσύνη είναι θεμελιώδες για τη δημιουργία εφαρμογών όπως το Stable Diffusion και το Midjourney, θα ήταν καταστροφικό για τον κλάδο της τεχνητής νοημοσύνης αν οι χρήστες άρχιζαν να παράγουν παράνομες φωτορεαλιστικές εικόνες. Αντίθετα, η ανοιχτή φύση αυτού του συνόλου δεδομένων επέτρεψε στην κοινότητα να αποκαλύψει το επικίνδυνο περιεχόμενο και να παρακινήσει μια διόρθωση, δήλωσε ο Σύνδεσμος Β.

Επιπλέον, μεγάλο μέρος αυτού του πρώτου συνόλου δεδομένων βασίστηκε σε web scraping που πραγματοποιήθηκε από το τεράστιο Common Crawl, το οποίο αξιοποιήθηκε επίσης για τα μοντέλα ChatGPT και LLAMA. Ακόμα και ως Οι ανιχνευτές τεχνητής νοημοσύνης (AI crawlers) συνεχίζουν να εκφράζουν ανησυχίες σχετικά με τη συγγραφή κειμένων, την ιδιωτικότητα και την προκατειλημμένη και ρατσιστική επισήμανση., ωστόσο, οι προγραμματιστές στην κοινότητα της Τεχνητής Νοημοσύνης είναι Εργαζόμαστε πάνω σε τρόπους καθαρισμού τμημάτων του αναπτυσσόμενου συνόλου δεδομένων ανοιχτού κώδικα του Common Crawl για ασφαλέστερη χρήση.

Καθώς οι προγραμματιστές στοχεύουν όχι μόνο στη δημιουργία ισχυρής Τεχνητής Νοημοσύνης, αλλά και Τεχνητής Νοημοσύνης στην οποία μπορούμε να εμπιστευτούμε, τόσο οι χρήστες όσο και ο κλάδος προστατεύονται από τη διαφάνεια και τη συνεργασία του πραγματικού ανοιχτού κώδικα.

Υιοθετώντας την πορεία του ανοιχτού κώδικα

Καθώς πολλοί εξακολουθούν να είναι επιφυλακτικοί απέναντι σε αυτήν την αναπτυσσόμενη τεχνολογία, ο αγώνας για να γίνει το iOS ή το Android μεγάλων μοντέλων εμπορευμάτων τεχνητής νοημοσύνης βρίσκεται σε εξέλιξη — και καθώς η παγκόσμια κοινότητα της τεχνητής νοημοσύνης κυριολεκτικά κατασκευάζει αυτό που θα γίνει το πρότυπο για το μέλλον και τα συστήματα τεχνητής νοημοσύνης ήδη οδηγούν αυτοκίνητα και προσφέρουν ιατρικές αξιολογήσεις, η εδραίωση εμπιστοσύνης μέσω της δημιουργίας αμερόληπτης, αξιόπιστης και ασφαλούς τεχνητής νοημοσύνης δεν ήταν ποτέ πιο κρίσιμη.

Καθώς η κοινότητα Τεχνητής Νοημοσύνης της Κίνας προσπαθεί να τοποθετηθεί ως πρωτοπόρος της ανοιχτής καινοτομίας, ο δρόμος προς την ασφαλή Τεχνητή Νοημοσύνη βρίσκεται μόνο στη διαφάνεια του πραγματικού ανοιχτού κώδικα, η οποία έχει αποδειχθεί μέσα από δεκαετίες καινοτομίας λογισμικού. Η χρήση του όρου σε συστήματα που δεν μοιράζονται κρίσιμα κομμάτια, όπως δεδομένα, δεν επιτρέπει στους προγραμματιστές να διερευνήσουν, να αναπαράγουν και να επαναλάβουν. Ενώ η γοητεία των άμεσα διαθέσιμων μοντέλων όπως τα DeepSeek, ERNIE 4.5, Kimi K2 και Qwen3 είναι αναμφισβήτητη, οι προγραμματιστές που τα αξιοποιούν ανταλλάσσουν τη διαφάνεια που ενθαρρύνει τη συνεργασία και την καινοτομία για λόγους ευκολίας.

Η κοινότητα της Τεχνητής Νοημοσύνης πρέπει να επιλέξει: να υιοθετήσει ριζοσπαστική διαφάνεια μέσω γνήσιου ανοιχτού κώδικα ή να διακινδυνεύσει να κατασκευάσει τα κρίσιμα συστήματα του αύριο στα σημερινά μαύρα κουτιά.

Ο Δρ. Τζέισον Κόρσο είναι συνιδρυτής και επικεφαλής επιστημονικός διευθυντής της voxel51, και καθηγητής Ρομποτικής και Ηλεκτρολόγων Μηχανικών & Επιστήμης Υπολογιστών στο Πανεπιστήμιο του Μίσιγκαν. Βετεράνος στον τομέα της υπολογιστικής όρασης, ο Δρ. Κόρσο έχει αφιερώσει πάνω από 20 χρόνια στην ακαδημαϊκή έρευνα στους τομείς της κατανόησης βίντεο, της ρομποτικής και της επιστήμης δεδομένων.