Η γωνία του Anderson
Μέθοδοι IP-Πλυντηρίου σε AI

Εάν υπάρχει νομική εκδίκηση που έρχεται για τη χρήση πνευματικής ιδιοκτησίας στην εκπαίδευση του AI, υπάρχουν επίσης διάφορες μεθόδοι για να αποκρύψουν τέτοια χρήση.
Γνώμη Η τρέχουσα, ταχέως εξελισσόμενη επανάσταση στη γενετική AI αναπτύσσεται στο πιο νομικά προβληματικό περιβάλλον που έχει συνοδεύσει οποιαδήποτε μετασχηματιστική τεχνολογική ανάπτυξη από τον δέκατο ένατο αιώνα.
Μέχρι 3-4 χρόνια πριν, η κοινότητα έρευνας μηχανικής μάθησης είχε μια σιωπηρή (συχνά ρητή) εντολή να εκμεταλλευτεί υλικό που προστατεύεται από πνευματικά δικαιώματα κατά τη διάρκεια της ανάπτυξης νέων συστημάτων· από τότε αυτά τα συστήματα δεν ήταν ακόμη επιτυχημένα, σε σχέση με την ωριμότητα ή την εμπορική βιωσιμότητα, τα αποτελέσματα ήταν, σε κάθε sentido, ακαδημαϊκά.
Σε εκείνη την περίοδο, η απότομη επιτυχία μιας νέας γενιάς μοντέλων μεγάλης κλίμακας που βασίζονται σε διάχυση (LLMs, όπως το ChatGPT και το Claude) και Μοντέλων Όρασης-Γλώσσας (VLMs, όπως το Sora) σήμανε ότι αυτές οι αφηρημένες και μέχρι τώρα ‘αβλαβείς’ γραμμές έρευνας είχαν εξελιχθεί σε εμπορική βιωσιμότητα και ξεπέρασαν το ‘δωρεάν πέρασμα’, όσον αφορά την εκμετάλλευση της πνευματικής ιδιοκτησίας άλλων.
Από τώρα και στο εξής, οι κάτοχοι δικαιωμάτων θα ζητούν μερίδιο στα οφέλη των συστημάτων AI που εκπαιδεύονται σε μεγάλο βαθμό ή εν μέρει σε προστατευμένα δεδομένα, οδηγώντας σε μια συνεχιζόμενη καταιγίδα νομικών υποθέσεων που απαιτεί κάποια προσπάθεια για να τις παρακολουθήσετε.

Εδώ περιορισμένο μόνο σε υποθέσεις που κατατέθηκαν στις ΗΠΑ, νέες υποθέσεις εμφανίζονται με φρενήρη ρυθμό στις Ηνωμένες Πολιτείες και πέραν. Πηγή
Εξαναγκασμός για ένα ‘Δωρεάν Γεύμα’
Η οικονομική δέσμευση που συμβαίνει目前 σε σχέση με την υποδομή AI έχει θεωρηθεί από ορισμένες φωνές ως προσπάθεια να εδραιώσει ‘πνευματικά-επικίνδυνα’ AI τόσο βαθιά στην οικονομία της κοινωνίας, ώστε να γίνει όχι μόνο ‘πολύ μεγάλο για να αποτύχει’, αλλά και ‘πολύ ισχυρό για να μην μπορεί να διωχθεί’ – ή τουλάχιστον τόσο ισχυρό, που επιτυχημένες αγωγές δεν θα επιτρέπονταν να ανατρέψουν την επανάσταση.
Προς αυτή τη γενική στάση, ο τρέχων πρόεδρος των Ηνωμένων Πολιτειών είναι υποχρεωμένος στην πολιτική την άποψή του ότι ‘Δεν μπορείτε να περιμένετε να έχετε ένα επιτυχημένο πρόγραμμα AI όταν κάθε άρθρο, βιβλίο ή οτιδήποτε άλλο που έχετε διαβάσει ή μελετήσει, πρέπει να πληρώσετε για αυτό’.
Πραγματικά; Τίποτα που να μοιάζει ή να είναι συγκρίσιμο δεν έχει συμβεί στη δυτική βιομηχανική εποχή, και αυτό αντιπροσωπεύει μια κίνηση που ερεθίζει σοβαρά ενάντια στη παραδοσιακή αμερικανική κουλτούρα της δίκης και της αποζημίωσης· ίσως οι κοντινότερες παρόμοιες θέσεις είναι η υποχρεωτική λήξη των πατεντών φαρμάκων μετά από 20 χρόνια (η οποία είναι συχνά υπό επίθεση), και η περιορισμός των προσδοκιών για ιδιωτικότητα σε δημόσιους χώρους.
Ωστόσο, οι καιροί αλλάζουν· στην απουσία οποιασδήποτε εγγύησης ότι η τρέχουσα τάση προς ‘εminent domain’ ενάντια στις προστασίες IP δεν θα αποτύχει ή θα αναστραφεί αργότερα, υπάρχουν ορισμένες δευτερεύουσες προσεγγίσεις που γίνονται τυπική πρακτική στην ανάπτυξη συστημάτων AI και την αντιμετώπιση των πολύ αμφισβητούμενων δεδομένων εκπαίδευσης που τις τροφοδοτούν.
Δεδομένα-με-Διαμεσολαβητή
Μια από αυτές τις προσεγγίσεις ακολουθεί μια αξιοσημείωτα παρόμοια προσέγγιση με την (όχι πάντα επιτυχημένη) άμυνα από τους ιστότοπους λίστας torrent που δεν φιλοξενούν κανένα αμφισβητούμενο υλικό – ή κανένα υλικό καθόλου.
Εκτός από το να αποφεύγουν την ανάγκη να αποθηκεύουν και να εξυπηρετούν μεγάλες ποσότητες ελάχιστα συμπιεστών δεδομένων εικόνας ή βίντεο, συλλογές αυτού του είδους επιτρέπουν γρήγορη ενημέρωση – όπως η αφαίρεση υλικού με αίτημα των κατόχων πνευματικών δικαιωμάτων – και εκδόσεις.
Όπως οι λίστες torrent είναι μόνο σημάνσεις για το πού μπορείτε να βρείτε προστατευμένο από πνευματικά δικαιώματα υλικό, ένας αριθμός πολύ επιδραστικών συνόλων δεδομένων είναι ο ίδιος μόνο ‘pointer’-style λίστες υφιστάμενων δεδομένων· αν ο τελικός χρήστης θέλει να χρησιμοποιήσει αυτές τις λίστες ως λίστα λήψης για το δικό του σύνολο δεδομένων, αυτό είναι πάνω του, όσον αφορά την ευθύνη των επιμελητών.
Μεταξύ αυτών είναι το σύνολο δεδομένων Conceptual 12M της Google Research, το οποίο παρέχει λεζάντες για εικόνες, αλλά μόνο δείχνει θέσεις στο διαδίκτυο όπου αυτές οι εικόνες υπάρχουν (ή υπήρχαν την εποχή της επιμέλειας):

Δύο παραδείγματα από το σύνολο δεδομένων Conceptual 12M της Google Research. Πηγή
Ένα άλλο εξέχον παράδειγμα, και ένα που τώρα έχει μια έγκυρη αξίωση για σεβασμό στην ιστορία του AI, είναι το σύνολο δεδομένων LAION που διευκόλυνε την επανάσταση του συστήματος Stable Diffusion το 2022 – το πρώτο τέτοιο πλαίσιο που προσφέρει ισχυρά ανοιχτά γενετικά εικόνες σε τελικούς χρήστες, όπως φαίνεται να καθιερώνουν τέτοιες υπηρεσίες ως αποκλειστικά εμπορικό τομέα:

Ένα από τα πολλά παραδείγματα του προγράμματος LAION, με σύγχρονα και πνευματικά δικαιώματα έργα. Πηγή
Σε πολλές περιπτώσεις, οι μεγάλες διαστάσεις αρχείων αυτών των ‘pointer’ συλλογών δείχνουν την περιεκτικότητα εικόνας· ωστόσο, οι μη τριβικές διαστάσεις λήψης είναι συχνά λόγω του μεγάλου όγκου κειμένου, και μερικές φορές της περιεκτικότητας εξαγώγιμων εμβυθών ή χαρακτηριστικών – αποσπάσματα ή κόμβοι άλλου εφαρμοστέου περιεχομένου που εξάγονται από τα πηγαία δεδομένα κατά τη διάρκεια της διαδικασίας εκπαίδευσης.
Το Βίντεο Premium
Τα σύνολα δεδομένων βίντεο παρουσιάζουν ακόμη πιο ισχυρό επιχείρημα για την ‘dataset-by-proxy’ ή την προσέγγιση του δείκτη, поскольку ο μεγάλος όγκος δεδομένων αποθήκευσης που απαιτείται για την συγκέντρωση ενός σημαντικού και χρήσιμου αριθμού βίντεο σε μια seule λήψη είναι απαγορευτικός, και μια ‘κατανεμημένη’ μέθοδος είναι επιθυμητή.
Ωστόσο, και στις δύο περιπτώσεις – αλλά ιδιαίτερα με το βίντεο – οι λήψιμες διευθύνσεις URL αντιπροσωπεύουν δεδομένα που θα χρειαστούν σημαντική weitere προσοχή πριν χρησιμοποιηθούν σε διαδικασίες εκπαίδευσης. Και οι εικόνες και τα βίντεο θα χρειαστούν να αναδιαμορφωθούν ή να γίνουν αποφάσεις περικοπής, για να δημιουργηθούν δείγματα που θα ταιριάζουν στο διαθέσιμο χώρο GPU. Ακόμη και σοβαρά υποδειγματισμένα βίντεο θα απαιτήσουν κοπή σε πολύ σύντομες διάρκειες, όπως 3-5 δευτερόλεπτα, συνήθως.
Σημαντικά σύνολα δεδομένων βίντεο που χρησιμοποιούν αναφορές σε διαδικτυακά βίντεο (αντί της επιμέλειας και της άμεσης συσκευασίας βίντεο) περιλαμβάνουν το σύνολο δεδομένων Kinetics Human Action Video της Google, και τη συλλογή YouTube-8M της εταιρείας, η οποία χρησιμοποιεί σημείωση τμήματος για να δείξει πώς να αντιμετωπιστούν κάθε βίντεο μια φορά ληφθεί – αλλά η οποία αφήνει τον τελικό χρήστη να λάβει τα βίντεο από τις παρεχόμενες διευθύνσεις URL.
Κλείσιμο και Άνοιγμα
Τέλος, σε αυτήν την κατηγορία, ‘ανοιχτά’ δεδομένα VFX μπορεί να γεννηθούν με κλειστά πλαίσια που στη συνέχεια δημοσιεύουν και κάνουν διαθέσιμα το σύνολο δεδομένων. Είναι εύλογο να αναρωτηθούμε γιατί συμβαίνει αυτό, και να σκεφτούμε αν αυτό μπορεί να συμβεί επειδή η εταιρεία που το προέρχεται θέλει να αποστειρώσει ένα IP-αντίθετο μοντέλο, για τη δική της χρήση· ή ότι ένα ‘πλυμένο’ σύνολο ζητήθηκε από έξω.
Ένα τέτοιο παράδειγμα ‘γενεαλογικής πλυσίματος’ είναι, ενδεχομένως, το σύνολο δεδομένων Omni-VFX, το οποίο περιλαμβάνει πολλά σημεία δεδομένων από το σύνολο δεδομένων Open-VFX (το οποίο με τη σειρά του αναφέρεται σε πολλά κλειστά και ημι-κλειστά πλαίσια, όπως Pika και PixVerse).
Για να είμαι ειλικρινής, το Omni-VFX δεν προσπαθεί ούτε καν:

Στο ανοιχτό σύνολο δεδομένων Omni-VFX, ένα οικείο πρόσωπο. Πηγή
Γενεαλογική Ευθύνη
Η δεύτερη κύρια προσέγγιση για το IP-πλύσιμο είναι μέσω της χρήσης προστατευμένου υλικού σε ένα ή πολλά στάδια. Μια από τις μεθόδους σε αυτήν την κατηγορία είναι η χρήση συνθετικών δεδομένων που έχουν εκπαιδευτεί, σε κάποιο σημείο ροής, σε προστατευμένα δεδομένα. Σε τέτοιες περιπτώσεις, ιδιαίτερα όπου τα συνθετικά δεδομένα μπορούν να αποκτήσουν αυθεντικά αποτελέσματα, το προστατευμένο έργο παρέχει μετασχηματισμούς που δεν θα μπορούσαν να γίνουν εύλογα να γυρίσουν ή να προσεγγίσουν από γενικούς κόσμους μοντέλων ή μη εξειδικευμένων μοντέλων.
Αυτό είναι ιδιαίτερα το caso όπου τα συστήματα γενετικών βίντεο απαιτούνται να παράγουν ‘αδύνατα’ γεγονότα, και γεγονότα που θα πέσουν γενικά στην κατηγορία ‘οπτικών εφέ’ (VFX).
Στην πραγματικότητα, αυτό που έφερε αυτό το θέμα στο μυαλό μου ήταν η τελευταία σε μια σειρά ερευνητικών εργασιών που προσφέρουν τη δυνατότητα να ‘απομακρύνουν’ διάφορα είδη οπτικών εφέ, όπως η παραγωγή laser δέσμων από απίθανους τομείς του σώματος, είτε με την εκπαίδευση σε ειδικά επιθυμητά ή ‘ανοιχτά’ VFX κλιπ (μehr από την πιο προφανή πηγή, όπως τα πολύ ακριβά VFX shots που βρέθηκαν στην έξοδο από το κινηματογραφικό σύμπαν Marvel):
Παραδείγματα από την ιστοσελίδα EffectMaker, όπου η ‘δράση’ στο αρχικό κλιπ (μακρύ αριστερά) εφαρμόζεται σε μια πηγή εικόνας (κέντρο). Πηγή
Τα παραπάνω παραδείγματα προέρχονται από την ιστοσελίδα του προγράμματος για το EffectMaker. Το EffectMaker δεν είναι ούτε η πρώτη προσφορά αυτή τη χρονιά που ζητά να εξαγάγει VFX δυναμικά από ένα βίντεο κλιπ και να τα μεταφέρει σε ένα νέο κλιπ, και στην πραγματικότητα αυτό γίνεται σε μια διακριτή υπο-εργασία στην έρευνα AI VFX*.
Γνωρίζοντας ότι οι μεγάλες εταιρείες μέσων ενημέρωσης, όπως το Marvel, έχουν μια υψηλότερη από το μέσο όρο πιθανότητα να κερδίσουν νομικές υποθέσεις για πνευματικά δικαιώματα (ακόμη και στο προαναφερθέν κλίμα ‘ενεβλημένης ανοχής’), οι εταιρείες οπτικών εφέ και οι νεοφυείς επιχειρήσεις κάνουν τώρα αξιοσημείωτες προσπάθειες για να διασφαλίσουν ότι τα γενετικά VFX πλαίσιά τους είναι ελεύθερα από την εταιρική IP άλλων εταιρειών.
Πρώτα απ’ όλα, η Meta, η οποία έχει αναφερθεί στο subreddit r/vfx να έχει κάνει μια καλά αμειβόμενη χειμερινή προσθήκη σε εργασία μέχρι το 2026, προσφέροντας στους καλλιτέχνες VFX εργασία για την εκπαίδευση μοντέλων AI για την παραγωγή οπτικών εφέ σε επίπεδο Hollywood. Αν και η αμοιβή δεν καθορίστηκε σε διάφορες αναρτήσεις, μια περιέγραψε ως ‘χρήματα συνταξιοδότησης’.
Ακολουθήστε τα Χρήματα
Ωστόσο, πρέπει να αναρωτηθούμε πόσο χρήματα ακόμη και οι εταιρείες όπως η Meta είναι διατεθειμένες να πληρώσουν για μια πραγματική ποικιλία και αφθονία ad hoc VFX shots, δεδομένου ότι ο μέσος όρος ένας VFX shot για μια ταινία blockbuster είναι γύρω στα 42.000 δολάρια ΗΠΑ – και πολλά έρχονται σε πολύ υψηλότερες τιμές.
Επιπλέον, είναι λογικό να υποθέσουμε ότι τα εξειδικευμένα VFX-γενετικά μοντέλα AI θα ανταποκριθούν στην δημοφιλή ζήτηση, συμπεριλαμβανομένων διάφορων τυπικών εφέ-τρόπων από τις πιο δημοφιλείς και ακριβές κατηγορίες ταινιών.
Εκτός από το γεγονός ότι ‘υπόλοιπα’ επαγγελματίες VFX μπορεί να βρεθούν να αναδημιουργούν shots που εργάστηκαν για μια υπάρχουσα ταινία-κατάλογο† – το οποίο με τη σειρά του τοποθετεί την ‘εustom’ εργασία συνόλου δεδομένων ως μιμητική – δεν υπάρχει καμία εγγύηση ότι αυτά τα ακριβά νέα δείγματα θα εκπαιδευτούν ‘από το μηδέν’ σε μια εντελώς νέα αρχιτεκτονική.
Στην πραγματικότητα, αν αυτές οι αναδημιουργίες κατευθυνθούν σε ενδιάμεσους модούλους όπως LoRAs, οι οποίοι βασίζονται σε ένα βασικό μοντέλο, τότε η διαδικασία είναι μόνο τόσο αμυντική όσο το βασικό μοντέλο είναι ‘IP-καθαρό’ – και δεν είναι πολλά.
Ομοίως, αν η ‘νέα’ διαδικασία χρησιμοποιεί άλλες ‘υβριδικές’ τεχνικές, όπως λεπτοβελτίωση, όπου η αξία του οπτικού εφέ βασίζεται σε μοντέλα, πriors, ή εμβυθώσεις από παλαιότερες συλλογές ή μοντέλα αμφισβητούμενης ακεραιότητας, η πρωτοτυπία του έργου είναι αμφισβητούμενη και υπόκειται σε πρόκληση.
Αδύνατες Αποστολές
Το πεδίο της έξοδος VFX είναι μια ιδιαίτερα ενδιαφέρουσα μελέτη περίπτωσης σε σχέση με το πιθανό IP-πλύσιμο σε σύνολα δεδομένων AI,既然 τα οπτικά εφέ shots συχνά απεικονίζουν ‘αδύνατα’ πράγματα για τα οποία δεν θα υπάρχουν ανοιχτές εναλλακτικές.
Για παράδειγμα, ενώ η κατεδάφιση eines κτηρίου θα μπορούσε να εκπαιδευτεί σε ένα γενετικό μοντέλο από διάφορες δημόσιες ή άλλως προσιτές κλιπ stock, αν θέλετε να εκπαιδεύσετε ένα μοντέλο να παράγει ανθρώπινες laser δέσμες, θα πρέπει να εκπαιδεύσετε σε VFX κλιπ, κλεμμένα ή επιθυμητά; τέτοια πράγματα δεν συμβαίνουν σε κανένα άλλο μέρος.
Ακόμη και σε άλλους τύπους φυσικών καταστροφών, όπως δραματικές πλημμύρες, διαθέσιμο πραγματικό υλικό πηγής είναι απίθανο να μπορεί να αναπαράγει δραματικές POVs σε καταστροφικές εκδηλώσεις, επειδή (με ορισμένες εξαιρέσεις) οι άνθρωποι δεν ζουν συνήθως σε καταστροφικές τοποθεσίες. Επομένως, ‘δυνατά’ views σε καταστροφές είναι σπάνια σε πραγματικά σύνολα δεδομένων, και οποιοδήποτε μοντέλο AI που μπορεί να τα παράγει πιθανότατα έλαβε τις πληροφορίες από αλλού.
Οι περισσότεροι επιθυμητοί AI-ταχύτητες δεν έχουν αυτό το επίπεδο συγκεκριμένης ιδιότητας, και σε τέτοιες περιπτώσεις η αποκρύψη των οφελών του προστατευμένου από πνευματικά δικαιώματα υλικού μπορεί να μην απαιτεί τόσο μεγάλη προσπάθεια.
Συμπέρασμα: Εμπλεγμένος Ιστός
Μόνο εκείνοι που έχουν χρησιμοποιήσει γενετική AI εκτενώς και για μια συνεχή περίοδο θα κατανοήσουν ενστικτωδώς ότι τέτοιες συστήματα αγωνίζονται να συνδυάσουν πολλαπλά концепτά όταν δεν υπάρχουν συγκρίσιμα παραδείγματα στις εκπαιδευτικές τους δεδομένες.
Αυτή η περιορισμός είναι γνωστός ως εμπλέξη, όπου οι διάφορες πτυχές των εκπαιδευμένων концепτών τείνουν να συσσωρεύονται μαζί με συναφείς στοιχεία, αντί να αποσυνθέτουν σε χρήσιμα, Lego-στυλ κτίρια που μπορούν να διατεθούν σε οποιαδήποτε νέα διαμόρφωση ο χρήστης μπορεί να επιθυμήσει.
Η εμπλέξη είναι μια αρχιτεκτονική βαρύτητα-λαγό που είναι σχεδόν αδύνατο να αποφευχθεί, τουλάχιστον για τις διάχυσης-βασισμένες προσεγγίσεις που χαρακτηρίζουν όλα τα μεγάλα τρέχοντα γενετικά AI-πλαίσια. Ωστόσο, μπορεί να είναι ότι νέες προσεγγίσεις αναπτύσσονται τα επόμενα χρόνια που είναι καλύτερες στο να διακριβώσουν εκπαιδευμένα концепτά, ώστε να μπορούν να κολληθούν πιο ευέλικτα, και να προσφέρουν λιγότερες ενδείξεις σχετικά με την προέλευσή τους.
* Δεν κάνω κατηγορίες ενάντια στο EffectMaker, αλλά σχολιάζω εδώ τη γενικότητα μιας αναδυόμενης πρακτικής στην έρευνα AI βίντεο.
† Επειδή αυτές οι λήψεις, σε αυτά τα είδη ταινιών, έχουν παράγει και συνεχίζουν να παράγουν χρήματα.
Πρώτη δημοσίευση Δευτέρα, 16 Μαρτίου 2026












