Connect with us

Μέθοδοι IP-Washing στο AI

Η γωνία του Anderson

Μέθοδοι IP-Washing στο AI

mm
An AI-generated image of Lady Justice surrounded by 'laundered' data. GPT-1.5.

Εάν υπάρχει νομική εκδίκηση που έρχεται για τη χρήση πνευματικής ιδιοκτησίας στην εκπαίδευση του AI, υπάρχουν επίσης διάφορες μέθοδοι για να αποκρύψουν μια τέτοια χρήση.

 

Γνώμη Η τρέχουσα, γρήγορα εξελισσόμενη επανάσταση στο γεννητικό AI αναπτύσσεται στο πιο νομικά προβληματικό περιβάλλον που έχει συνοδεύσει οποιαδήποτε μεταμορφωτική τεχνολογική ανάπτυξη από τον δέκατο ένατο αιώνα.

Έως 3-4 χρόνια πριν, η κοινότητα έρευνας μηχανικής μάθησης είχε μια σιωπηρή (συχνά ρητή) άδεια να εκμεταλλεύεται υλικό που προστατεύεται από πνευματικά δικαιώματα κατά την ανάπτυξη νέων συστημάτων· από τότε αυτά τα συστήματα δεν ήταν ακόμη επιτυχημένα, σε σχέση με την ωριμότητα ή την εμπορική βιωσιμότητα, τα αποτελέσματα ήταν, σε κάθε sentido, ακαδημαϊκά.

Σε εκείνη την περίοδο, η ξαφνική επιτυχία μιας νέας γενιάς διαχυτικών μεγάλων γλωσσικών μοντέλων (LLMs, όπως το ChatGPT και το Claude) και οπτικο-γλωσσικών μοντέλων (VLMs, όπως το Sora) σήμανε ότι αυτές οι αφηρημένες και μέχρι τώρα ‘αβλαβείς’ γραμμές έρευνας είχαν εξελιχθεί σε εμπορική βιωσιμότητα και είχαν ξεπεράσει το ‘δωρεάν πέρασμα’, όσον αφορά την εκμετάλλευση της πνευματικής ιδιοκτησίας άλλων.

Από τώρα και στο εξής, οι κάτοχοι δικαιωμάτων θα ζητούν μερίδιο στα οφέλη των συστημάτων AI που εκπαιδεύονται σε μεγάλο βαθμό ή εν μέρει σε δεδομένα που προστατεύονται από πνευματικά δικαιώματα, οδηγώντας σε μια συνεχιζόμενη αβαλάντζα νομικών υποθέσεων που απαιτεί κάποια προσπάθεια για να τις παρακολουθήσετε.

Περιορισμένο μόνο σε υποθέσεις που εκδικάζονται στις ΗΠΑ, νέες υποθέσεις εμφανίζονται με φρενήρη ρυθμό στις Ηνωμένες Πολιτείες και πέραν.

Εδώ, περιορισμένο μόνο σε υποθέσεις που εκδικάζονται στις ΗΠΑ, νέες υποθέσεις εμφανίζονται με φρενήρη ρυθμό στις Ηνωμένες Πολιτείες και πέραν. Πηγή

Μια ‘Δωρεάν Γεύμα’

Η οικονομική δέσμευση που συμβαίνει τώρα σε σχέση με την υποδομή που εξυπηρετεί το AI έχει υποστηριχθεί από ορισμένες φωνές ως προσπάθεια να εδραιώσουν ‘πνευματικά δικαιώματα-επικίνδυνες’ AI τόσο βαθιά στην οικονομία της κοινωνίας, ώστε να γίνει όχι μόνο ‘πολύ μεγάλη για να αποτύχει’, αλλά και ‘πολύ ισχυρή για να μην μπορεί να δικαστεί’ – ή τουλάχιστον τόσο ισχυρή, που οι επιτυχημένες αγωγές δεν θα επιτρέπονταν να ανατρέψουν την επανάσταση.

Προς αυτή τη γενική στάση, ο τρέχων πρόεδρος των Ηνωμένων Πολιτειών είναι υποχρεωμένος σε πολιτική τη δική του άποψη ότι ‘Δεν μπορείτε να περιμένετε να έχετε ένα επιτυχημένο πρόγραμμα AI όταν κάθε άρθρο, βιβλίο ή οτιδήποτε άλλο που έχετε διαβάσει ή μελετήσει, πρέπει να πληρώσετε για αυτό’.

Πραγματικά; Τίποτα που να μοιάζει ή να είναι συγκρίσιμο δεν έχει συμβεί στη δυτική βιομηχανική εποχή, και αυτό αντιπροσωπεύει ένα κίνημα που τρίβει σοβαρά ενάντια στη παραδοσιακή αμερικανική κουλτούρα της δίκης και της αποζημίωσης· ίσως η κοντινότερη παρόμοια θέση είναι η υποχρεωτική λήξη των πατεντών φαρμάκων μετά από 20 χρόνια (η οποία είναι συχνά υπό επιθεση), και η περιορισμός των προσδοκιών για ιδιωτικότητα σε δημόσιους χώρους.

Ωστόσο, οι καιροί αλλάζουν· στην απουσία οποιασδήποτε εγγύησης ότι η τρέχουσα τάση προς ‘εminent domain’ ενάντια στις προστασίες πνευματικών δικαιωμάτων δεν θα αποτύχει ή δεν θα αναστραφεί αργότερα, υπάρχουν διάφορες δευτερεύουσες προσεγγίσεις που γίνονται τυποποιημένες πρακτικές στην ανάπτυξη συστημάτων AI και τη μεταχείριση των πολύ αμφισβητούμενων δεδομένων εκπαίδευσης που τα τροφοδοτούν.

Δεδομένα-με-Διαμεσολαβητή

Μια από αυτές τις προσεγγίσεις ακολουθεί μια αξιοσημείωτα παρόμοια προσέγγιση με την (όχι πάντα επιτυχημένη) άμυνα από τους ιστότοπους λίστας torrent που δεν φιλοξενούν πραγματικά aucun αμφισβητούμενο υλικό – ή οποιοδήποτε υλικό.

Εκτός από το να αποφεύγουν την ανάγκη να αποθηκεύουν και να εξυπηρετούν μεγάλες ποσότητες ελάχιστα συμπιεστών εικόνων ή βίντεο, συλλογές αυτού του είδους επιτρέπουν τη γρήγορη ενημέρωση – όπως η αφαίρεση υλικού στις αιτήσεις των κατόχων πνευματικών δικαιωμάτων – και εκδόσεις.

Ακριβώς όπως τα torrents είναι μόνο σημάνσεις για το πού μπορείτε να βρείτε υλικό που προστατεύεται από πνευματικά δικαιώματα, một αριθμός εξαιρετικά επιρροών συλλογών δεδομένων είναι ο ίδιος μόνο ‘pointer’-στυλ λίστες υφιστάμενων δεδομένων· εάν ο τελικός χρήστης θέλει να χρησιμοποιήσει αυτές τις λίστες ως λίστα λήψης για τη δική του συλλογή δεδομένων, αυτό είναι πάνω του, όσον αφορά την ευθύνη των συντηρητών.

Μεταξύ αυτών είναι το Conceptual 12M dataset της Google Research, το οποίο παρέχει λεζάντες για εικόνες, αλλά μόνο δείχνει θέσεις στο διαδίκτυο όπου αυτές οι εικόνες υπάρχουν (ή υπήρχαν την εποχή της συλλογής):

Δύο παραδείγματα από τη συλλογή Conceptual 12M της Google Research.

Δύο παραδείγματα από τη συλλογή Conceptual 12M της Google Research. Πηγή

Ένα άλλο εξαιρετικό παράδειγμα, και ένα που τώρα έχει μια έγκυρη αξίωση σελαβόντας στην ιστορία του AI, είναι η LAION dataset που διευκόλυνε την εμφάνιση του συστήματος Stable Diffusion το 2022 – το πρώτο τέτοιο πλαίσιο που προσφέρει ισχυρά ανοιχτά γεννητικά εικόνες στους τελικούς χρήστες, ακριβώς όπως τα ιδιωτικά συστήματα φαίνονταν έτοιμα να καθορίσουν τέτοιες υπηρεσίες ως एक αποκλειστικά εμπορικό τομέα:

Ένα από τα πολλά παραδείγματα του έργου LAION, με σύγχρονα και πνευματικά δικαιώματα έργα τέχνης.

Ένα από τα πολλά παραδείγματα του έργου LAION, με σύγχρονα και πνευματικά δικαιώματα έργα τέχνης. Πηγή

Το Βίντεο Premium

Τα βίντεο datasets παρουσιάζουν ένα ακόμα ισχυρότερο επιχείρημα για την προσέγγιση ‘dataset-by-proxy’ ή pointer,既然 η μεγάλη ποσότητα αποθήκευσης δεδομένων που απαιτείται για να συλλέξει ένα σημαντικό και χρήσιμο αριθμό βίντεο σε μια seule λήψη συλλογή είναι απαγορευτική, και μια ‘κατανεμημένη’ μέθοδος είναι επιθυμητή.

Ωστόσο, και στις δύο περιπτώσεις – αλλά ιδιαίτερα με το βίντεο – οι λήψιμες πηγές URLs αντιπροσωπεύουν δεδομένα που θα χρειαστούν σημαντική περαιτέρω προσοχή πριν χρησιμοποιηθούν σε διαδικασίες εκπαίδευσης. Και οι εικόνες και τα βίντεο θα χρειαστούν να αναδιαμορφωθούν, ή else αποφάσεις cropping θα πρέπει να γίνουν, για να δημιουργηθούν δείγματα που θα ταιριάζουν στο διαθέσιμο χώρο GPU. Ακόμη και σοβαρά downsampled βίντεο θα χρειαστούν κοπή σε πολύ σύντομες διαρκείας, όπως 3-5 δευτερόλεπτα, τυπικά.

Σημαντικά βίντεο datasets που χρησιμοποιούν αναφορές σε online βίντεο (παρά την καλλιέργεια και την άμεση συσκευασία βίντεο) περιλαμβάνουν το Kinetics Human Action Video Dataset της Google, και τη συλλογή YouTube-8M της εταιρείας, η οποία χρησιμοποιεί σημείωση τμήματος για να δείξει πώς να αντιμετωπίζουν κάθε βίντεο μια φορά λήψη – αλλά που αφήνει τον τελικό χρήστη να λάβει τα βίντεο από τις παρεχόμενες URLs.

Κλειστό και Ανοιχτό

Τέλος, σε αυτή την κατηγορία, ‘ανοιχτά’ δεδομένα VFX μπορεί να παραχθούν με κλειστά πλαίσια που στη συνέχεια δημοσιεύουν και κάνουν διαθέσιμη τη συνακόλουθη συλλογή δεδομένων. Είναι εύλογο να αναρωτηθούμε γιατί συμβαίνει αυτό, και να εξετάσουμε εάν μπορεί να είναι επειδή η αρχική εταιρεία θέλει να σαπούνει ένα IP-αντίθετο μοντέλο ροής για τη δική της χρήση· ή else ότι μια ‘πλυμένη’ συλλογή ζητήθηκε από έξω.

Ένα τέτοιο παράδειγμα ‘γενεαλογικής πλύσης’ είναι, επιχειρηματικά, η Omni-VFX dataset, η οποία ενσωματώνει πολλά σημεία δεδομένων από τη Open-VFX dataset (η οποία με τη σειρά της αναφέρεται σε πολλά κλειστά και ημι-κλειστά πλαίσια, όπως Pika και PixVerse).

Για να είμαι ειλικρινής, η Omni-VFX δεν προσπαθεί πραγματικά:

Στη συλλογή ανοιχτού κώδικα Omni-VFX, ένα οικείο πρόσωπο.

Στη συλλογή ανοιχτού κώδικα Omni-VFX, ένα οικείο πρόσωπο. Πηγή

Αρχική Ευθύνη

Η δεύτερη κύρια προσέγγιση για το IP-washing είναι μέσω της χρήσης πνευματικής ιδιοκτησίας σε μια ή πολλές αποστάσεις. Μια από τις μεθόδους σε αυτή την κατηγορία είναι η χρήση συνθετικών δεδομένων που έχουν εκπαιδευτεί, σε κάποιο σημείο ροής, σε δεδομένα που προστατεύονται από πνευματικά δικαιώματα. Σε τέτοιες περιπτώσεις, ιδιαίτερα όπου τα συνθετικά δεδομένα μπορούν να λάβουν αυθεντικά αποτελέσματα, η πνευματική ιδιοκτησία παρέχει μετασχηματισμούς που δεν θα μπορούσαν να υπολογιστούν ή να προσεγγιστούν από γενικούς κόσμους μοντέλων ή μη εξειδικευμένων μοντέλων.

Αυτό είναι ιδιαίτερα η περίπτωση όπου τα γεννητικά συστήματα βίντεο απαιτούν να παράγουν ‘αδύνατα’ γεγονότα, και γεγονότα που θα ταξινομηθούν γενικά στην κατηγορία ‘οπτικά εφέ’ (VFX).

Πράγματι, αυτό που έφερε αυτό το θέμα στο μυαλό μου ήταν η τελευταία σε μια σειρά ερευνητικών εργασιών που προσφέρουν τη δυνατότητα να ‘απομακρύνουν’ διάφορα είδη οπτικών εφέ, όπως η παραγωγή laser δέσμων από απίθανους τμήματα του σώματος, είτε έχοντας εκπαιδευτεί σε ειδικά επιτροπές ή ‘ανοιχτές’ VFX κλιπ (παρά την πιο προφανή πηγή, όπως τα πολύ ακριβά VFX shots που βρίσκονται στην έξοδο από το Marvel σινεματικό σύμπαν):

Παραδείγματα από την ιστοσελίδα EffectMaker, όπου η ‘δράση’ στο αρχικό κλιπ (μακρυά αριστερά) εφαρμόζεται σε μια πηγή εικόνας (κέντρο). Πηγή

Τα παραπάνω παραδείγματα προέρχονται από την ιστοσελίδα του έργου για το EffectMaker project. EffectMaker δεν είναι ακόμη η πρώτη προσφορά αυτή τη χρονιά που επιδιώκει να εξαγάγει δυναμική VFX από ένα βίντεο κλιπ και να την μεταφέρει σε ένα νέο κλιπ, και στην πραγματικότητα αυτό γίνεται σε μια διακριτή υπο-εργασία στην έρευνα AI VFX*.

Γνωρίζοντας ότι οι μέγιστοι των μέσων ενημέρωσης, όπως η Marvel, έχουν μια υψηλότερη από το μέσο ποσοστό να κερδίζουν νομικές υποθέσεις για πνευματικά δικαιώματα (ακόμη και στην προαναφερθείσα κλίμα ‘εγκαταλελειμμένης ανεκτικότητας’), οι εταιρείες οπτικών εφέ και οι νεοφυείς επιχειρήσεις κάνουν τώρα αξιοσημείωτες προσπάθειες για να διαβεβαιώσουν ότι τα γεννητικά τους πλαίσια VFX είναι ελεύθερα από την πνευματική ιδιοκτησία άλλων εταιρειών.

Πρώτα από αυτά είναι η Meta, η οποία έχει αναφερθεί στο subreddit r/vfx να έχει κάνει μια καλά αμειβόμενη χειμώνα προσλήψεις στο 2026, προσφέροντας στους καλλιτέχνες VFX εργασία για την εκπαίδευση μοντέλων AI να βγάζουν Hollywood-επίπεδο οπτικά εφέ shots. Αν και η αμοιβή δεν ήταν καθορισμένη σε διάφορες αναρτήσεις, μια περιέγραψε την ως ‘χρήματα συνταξιοδότησης’.

Ακολουθήστε τα Χρήματα

Ωστόσο, πρέπει να αναρωτηθούμε πόσο χρήματα ακόμη και οι gibi Meta είναι διατεθειμένοι να πληρώσουν για μια πραγματική ποικιλία και αφθονία ad hoc VFX shots, δεδομένου ότι ο μέσος όρος ενός VFX shot για μια ταινία blockbuster είναι περίπου 42.000 δολάρια ΗΠΑ – και πολλά έρχονται πολύ υψηλότερα.

Πέραν του ότι είναι λογικό να υποθέσουμε ότι τα εξειδικευμένα μοντέλα VFX-γεννητικά AI θα υποκύψουν στην δημοφιλή ζήτηση, συμπεριλαμβανομένων των τυπικών εφέ tropes από τις πιο δημοφιλείς και ακριβές κατηγορίες ταινιών.

Εκτός από την άποψη ότι ‘υπόλοιπα’ επαγγελματίες VFX μπορεί να τελικά να αναδημιουργήσουν shots που δούλεψαν για μια υπάρχουσα ταινία καταλόγου – η οποία με τη σειρά της.contextualizes την ‘εξειδικευμένη’ δουλειά dataset ως μιμητική – δεν υπάρχει καμία εγγύηση ότι αυτά τα ακριβά νέα δείγματα θα τελικά εκπαιδευτούν ‘από το μηδέν’ σε μια εντελώς νέα αρχιτεκτονική.

Πράγματι, εάν τέτοιες αναδημιουργίες διευθύνονται σε ενδιάμεσους модούλους όπως LoRAs, οι οποίοι βασίζονται σε ένα βασικό μοντέλο, τότε η διαδικασία είναι τόσο αμυντική όσο το βασικό μοντέλο είναι ‘IP-καθαρό’ – και δεν υπάρχουν πολλά.

Ομοίως, εάν η ‘νέα’ διαδικασία χρησιμοποιεί άλλες ‘υβριδικές’ τεχνικές όπως fine-tuning, όπου η αξία του οπτικού εφέ βασίζεται σε μοντέλα, πriors, ή embeddings από παλαιότερες συλλογές ή μοντέλα αμφισβητούμενης ακεραιότητας, η πρωτοτυπία του έργου είναι αμφισβητήσιμη και υπόκειται σε αμφισβήτηση.

Αδύνατες Αποστολές

Το πεδίο της έξοδου VFX είναι μια ιδιαίτερα ενδιαφέρουσα μελέτη περίπτωσης σε σχέση με το πιθανό IP-washing στα datasets AI, поскольку τα οπτικά εφέ shots συχνά απεικονίζουν ‘αδύνατα’ πράγματα για τα οποία δεν θα υπάρχουν ανοιχτές εναλλακτικές λύσεις διαθέσιμες.

Για παράδειγμα, ενώ η κατεδάφιση ενός κτιρίου θα μπορούσε να εκπαιδευτεί σε ένα γεννητικό μοντέλο από διάφορα δημόσια κλιπ ή άλλου είδους προσιτά stock κλιπ, εάν θέλετε να εκπαιδεύσετε ένα μοντέλο να παράγει ανθρώπινες laser δέσμες, θα πρέπει να εκπαιδεύσετε σε VFX κλιπ, κλεμμένα ή επιτροπευμένα· τέτοια πράγματα δεν συμβαίνουν σε κανένα άλλο μέρος.

Ακόμη και στην περίπτωση άλλων τύπων φυσικών καταστροφών, όπως δραματικών πλημμυρών, το διαθέσιμο πραγματικό υλικό πηγής είναι απίθανο να μπορεί να αναπαράγει δραματικές POVs σε καταστροφικά γεγονότα, επειδή (με ορισμένες εξαιρέσεις) οι άνθρωποι δεν συνήθως live-stream από καταστροφικές τοποθεσίες. Έτσι ‘δύναμες απόψεις’ σε καταστροφές είναι σπάνιες σε πραγματικά datasets, και οποιοδήποτε μοντέλο AI που μπορεί να τις παράγει πιθανότατα έλαβε τις πληροφορίες αλλού.

Πολλά επιθυμητά ροή εργασιών AI δεν έχουν αυτό το επίπεδο специficity, και σε τέτοιες περιπτώσεις η αποκρύψυση των οφελών των δεδομένων που προστατεύονται από πνευματικά δικαιώματα μπορεί να μην απαιτεί σχεδόν τόσο μεγάλη προσπάθεια.

Συμπέρασμα: Ενταγμένο Δίκτυο

Μόνο εκείνοι που έχουν χρησιμοποιήσει εκτενώς και για μια μακρά περίοδο το γεννητικό AI θα κατανοούν αυθόρμητα ότι τέτοιες συστήματα δυσκολεύονται να συνδυάσουν πολλαπλά концепτά όταν δεν υπάρχουν συγκρίσιμα παραδείγματα στη συλλογή τους δεδομένων.

Αυτό το όριο είναι γνωστό ως ενταγμένο, όπου τα διάφορα σημεία των εκπαιδευμένων концепτών τείνουν να συσσωρευτούν μαζί με σχετικά στοιχεία, αντί να αποσυναρμολογηθούν σε χρήσιμες, Lego-στυλ οικοδομικά στοιχεία που μπορούν να διατεθούν σε οποιαδήποτε νέα διαμόρφωση ο χρήστης μπορεί να επιθυμήσει.

Το ενταγμένο είναι ένα αρχιτεκτονικό βαρύπεδο που είναι σχεδόν αδύνατο να ξεφύγει, τουλάχιστον για τις διαχυτικές προσεγγίσεις που χαρακτηρίζουν όλα τα μεγάλα τρέχοντα genAI πλαίσια. Ωστόσο, μπορεί να είναι ότι νέες προσεγγίσεις εμφανίζονται τα επόμενα χρόνια που είναι καλύτερες στο να διακριβώσουν τα εκπαιδευμένα концепτά ώστε να μπορούν να συνδυαστούν πιο ευέλικτα, και να προσφέρουν λιγότερες ενδείξεις για την προέλευσή τους.

 

* Δεν κάνω κατηγορίες ενάντια στο EffectMaker, αλλά σχολιάζω εδώ για τη γενικότητα μιας αναδυόμενης πρακτικής στην έρευνα βίντεο AI.

Επειδή αυτά τα shots, σε αυτούς τους τύπους ταινιών, έχουν παράγει και συνεχίζουν να παράγουν χρήματα.

Πρώτη δημοσίευση την Δευτέρα, 16 Μαρτίου 2026

Συγγραφέας για τη μηχανική μάθηση, ειδικός σε τομέα συνθέσεων εικόνων ανθρώπων. Πρώην επικεφαλής ερευνών περιεχομένου στη Metaphysic.ai.
Προσωπικός ιστότοπος: martinanderson.ai
Επικοινωνία: [email protected]