Connect with us

วิธีการล้าง IP ใน AI

มุมมองของ Anderson

วิธีการล้าง IP ใน AI

mm
An AI-generated image of Lady Justice surrounded by 'laundered' data. GPT-1.5.

หากมีการตัดสินตามกฎหมายเกี่ยวกับการใช้ทรัพย์สินทางปัญญาในการฝึกอบรม AI ก็มีวิธีการบิดเบือนการใช้งานดังกล่าวหลายวิธี

 

ความคิดเห็น การปฏิวัติ AI ที่สร้างสรรค์ใหม่ในปัจจุบันกำลังเกิดขึ้นในสภาพแวดล้อมทางกฎหมายที่ไม่มั่นคงมากที่สุดซึ่งเคยเกิดขึ้นพร้อมกับการพัฒนาทางเทคโนโลยีที่เปลี่ยนแปลงอย่างมาก ตั้งแต่ศตวรรษที่ 19.

จนถึง 3-4 ปีที่แล้ว ชุมชนการวิจัยการเรียนรู้ของเครื่องจักรได้รับการอนุญาตโดยไม่ชัดเจน (มักจะชัดเจน) ให้ใช้วัสดุที่ได้รับการคุ้มครองโดยทรัพย์สินทางปัญญาในการพัฒนาระบบใหม่ๆ; เนื่องจากระบบเหล่านี้ยังไม่ประสบความสำเร็จในแง่ของความเป็นมืออาชีพหรือความสามารถในการทำกำไรได้ ผลลัพธ์เหล่านั้นจึงเป็นเรื่องทางวิชาการโดยทุกประการ

ในช่วงเวลานั้น ความสำเร็จที่ไม่คาดคิดของระบบ Large Language Models รุ่นใหม่ (LLMs เช่น ChatGPT และ Claude) และ Vision-Language Models (VLMs เช่น Sora) ส่งสัญญาณว่าสายการวิจัยที่เป็นนามธรรมและไม่เป็นอันตรายในขณะนั้นได้พัฒนาเป็นความสามารถในการทำกำไรและเติบโตเกิน “การผ่านฟรี” ในเรื่องของการแสวงหาผลประโยชน์จากทรัพย์สินทางปัญญาของผู้อื่น

ตั้งแต่นี้ไป ผู้ถือสิทธิ์จะพยายามที่จะให้ได้รับส่วนแบ่งจากผลตอบแทนของระบบ AI ที่ได้รับการฝึกอบรมจากข้อมูลที่ได้รับการคุ้มครองโดยลิขสิทธิ์หรือการคุ้มครองอื่นๆ ส่งผลให้เกิด คดีทางกฎหมายที่กำลังดำเนินอยู่ ที่ต้องใช้ความพยายาม บางอย่าง เพื่อตาม dõiได้

Limited only to cases brought in the US, new cases emerge at a frenetic pace in the United States and beyond. Source - https://copyrightalliance.org/artificial-intelligence-copyright/court-cases/

ที่นี่จำกัดเฉพาะคดีที่นำเสนอในสหรัฐฯ คดีใหม่เกิดขึ้นในอัตราที่รวดเร็วในประเทศสหรัฐฯ และนอกเหนือจากนั้น แหล่งที่มา

การกำหนด ‘อาหารฟรี’

การมุ่งเน้นทางการเงินที่ เกิดขึ้นในปัจจุบัน ในเรื่องของโครงสร้างพื้นฐาน AI ได้ถูกเสนอโดยบางเสียงว่าเป็นความพยายามที่จะฝัง AI ที่มีความเสี่ยงด้านลิขสิทธิ์อย่างลึกซึ้งในการเศรษฐกิจของสังคมจนกลายเป็นไม่เพียงแต่ ‘ใหญ่เกินกว่าจะล้มเหลว’ แต่ยังเป็น ‘มีอำนาจเกินกว่าจะฟ้องร้อง’ – หรืออย่างน้อยก็ไม่สามารถปล่อยให้คดีที่ประสบความสำเร็จขัดขวางการปฏิวัติได้

ในทางเดียวกัน ประธานาธิบดีคนปัจจุบันของสหรัฐฯ กำลัง นำนโยบาย มุมมองของเขา ที่ว่า ‘คุณไม่สามารถคาดหวังให้มีโปรแกรม AI ที่ประสบความสำเร็จเมื่อทุกบทความ หนังสือ หรือสิ่งอื่นใดที่คุณอ่านหรือศึกษาคุณจะต้องจ่ายเงิน’

จริงๆ หรือ? ไม่มีอะไรที่คล้ายกันหรือเทียบเท่าที่เคยเกิดขึ้นในยุคอุตสาหกรรมตะวันตก และสิ่งนี้แสดงถึงการเคลื่อนไหวที่ขัดแย้งกับวัฒนธรรมการฟ้องร้องและชดเชยแบบดั้งเดิมของสหรัฐฯ; อาจเป็นตำแหน่งที่ใกล้เคียงที่สุดคือการหมดอายุของลิขสิทธิ์ยาที่มีผลต่อ 20 ปี (ซึ่ง ถูกโจมตี บ่อยครั้ง) และ ข้อจำกัด ในเรื่องความคาดหวังของความเป็นส่วนตัวในสถานที่สาธารณะ

อย่างไรก็ตาม เวลากำลังเปลี่ยนแปลงไป; ในการไม่มีการรับประกันว่าแนวโน้มปัจจุบันในการ ‘ยึดครอง’ ต่อการคุ้มครองทรัพย์สินทางปัญญา不会ล้มเหลวหรือถูกย้อนกลับในภายหลัง มีแนวทางรองหลายอย่างที่กำลังกลายเป็นมาตรฐานในการพัฒนา AI และการรักษาข้อมูลฝึกอบรมที่ถูกโต้แย้งอย่างมาก

ชุดข้อมูลโดยการแทนเจ้า

วิธีการหนึ่งในนี้ใช้แนวทางที่คล้ายกับการป้องกันของเว็บไซต์รายการทอร์เรนต์ที่บอกว่าพวกเขาไม่ได้โฮสต์ข้อมูลที่ถูกโต้แย้ง – หรือข้อมูลใดๆ เลย

นอกจากการหลีกเลี่ยงความจำเป็นในการจัดเก็บและให้บริการข้อมูลภาพหรือวิดีโอที่มีขนาดใหญ่แล้ว ชุดข้อมูลเหล่านี้ยังช่วยให้สามารถอัปเดตได้อย่างรวดเร็ว – เช่น การลบข้อมูลตามคำขอของผู้ถือสิทธิ์ – และการสร้างเวอร์ชัน

เช่นเดียวกับทอร์เรนต์ที่เป็นเพียงป้ายบอกทางไปยังที่ที่สามารถหาได้ข้อมูลที่มีลิขสิทธิ์ ชุดข้อมูลที่มีอิทธิพลสูงหลายชุดเป็นเพียง ‘รายการชี้’ ของข้อมูลที่มีอยู่; หากผู้ใช้สุดท้ายต้องการใช้รายการเหล่านี้เป็นรายการดาวน์โหลดสำหรับชุดข้อมูลของตนเอง นั่นก็เป็นเรื่องของความรับผิดชอบของผู้ดูแลแล้ว

ในหมู่นี้มี Conceptual 12M ของ Google Research ซึ่งให้คำบรรยายสำหรับภาพ แต่ชี้เฉพาะ ที่ตั้งบนเว็บ ที่ภาพเหล่านั้นมีอยู่ (หรือมีอยู่ในขณะทำการคัดเลือก):

ตัวอย่างสองรายการจาก Conceptual 12M ของ Google Research

ตัวอย่างสองรายการจาก Conceptual 12M ของ Google Research แหล่งที่มา

อีกตัวอย่างที่มีชื่อเสียงหนึ่งคือ LAION dataset ที่ทำให้เกิดการมาถึงของระบบ Stable Diffusion ใน ปี 2022 – ระบบแรกที่ให้บริการภาพสร้างสรรค์แบบเปิดสำหรับผู้ใช้สุดท้าย ในขณะที่ระบบที่มีลิขสิทธิ์ดูเหมือนจะสร้างบริการเหล่านี้ให้เป็นโดเมนเชิงพาณิชย์โดยสมบูรณ์:

หนึ่งในหลายรูปแบบของโครงการ LAION ซึ่งแสดงผลงานศิลปะสมัยใหม่ที่มีลิขสิทธิ์

หนึ่งในหลายรูปแบบของโครงการ LAION ซึ่งแสดงผลงานศิลปะสมัยใหม่ที่มีลิขสิทธิ์ แหล่งที่มา

ในหลายกรณี ขนาดไฟล์ที่ใหญ่ของชุด ‘ชี้’ เหล่านี้บ่งบอกถึงการรวมภาพเข้าด้วยกันในไฟล์ที่สามารถดาวน์โหลดและโฮสต์ได้; อย่างไรก็ตาม ขนาดดาวน์โหลดที่ไม่สำคัญมักจะเกิดจากปริมาณเนื้อหาที่มีขนาดใหญ่ และบางครั้งการรวมเอาเอ็มเบ็ดหรือ คุณลักษณะ – สรุปหรือโหนดของเนื้อหาที่ใช้ได้ซึ่งถูกดึงออกมาจากข้อมูลต้นฉบับระหว่างกระบวนการฝึกอบรม

พรีเมียมวิดีโอ

ชุดข้อมูลวิดีโอนำเสนอกรณีที่เข้มแข็งยิ่งขึ้นสำหรับแนวทาง ‘ชุดข้อมูลโดยการแทน’ หรือการชี้ เนื่องจากปริมาณการเก็บข้อมูลที่ต้องการในการรวบรวมวิดีโอที่มีจำนวนมากในคอลเลกชันเดียวนั้นเป็นเรื่องที่ยากมาก และวิธีการ ‘กระจาย’ จึงน่าสนใจ

อย่างไรก็ตาม ทั้งสองกรณี – แต่เฉพาะเจาะจงกับวิดีโอ – URL ที่สามารถดาวน์โหลดได้แสดงถึงข้อมูลที่จะต้องได้รับการดูแลเพิ่มเติมก่อนที่จะใช้ในกระบวนการฝึกอบรม ทั้งภาพและวิดีโอต้องถูกปรับขนาดหรือตัดสินใจ การตัด เพื่อสร้างตัวอย่างที่จะเข้ากับ พื้นที่ GPU ที่มีอยู่ วิดีโอที่ลดขนาดลงอย่างจริงจังจะต้องถูกตัดให้สั้นลงมาก เช่น 3-5 วินาที โดยทั่วไป

ชุดข้อมูลวิดีโอที่มีชื่อเสียงที่ใช้การอ้างอิงถึงวิดีโอบนเว็บ (แทนที่จะรวบรวมและจัดแพ็คเกจวิดีโอโดยตรง) รวมถึง Kinetics Human Action Video Dataset ของ Google และคอลเลกชัน YouTube-8M ของผู้ให้บริการค้นหาที่ใช้ การทำเครื่องหมายส่วน เพื่อแสดงวิธีการรักษาวิดีโอแต่ละครั้งหลังจากดาวน์โหลด – แต่ซึ่งปล่อยให้ผู้ใช้สุดท้ายได้รับวิดีโอจาก URL ที่ให้มา

ปิดและเปิด

สุดท้าย ในหมวดหมู่นี้ ‘เปิด’ ข้อมูล VFX อาจถูกสร้างขึ้นโดยใช้แพลตฟอร์มที่ปิดซึ่งเผยแพร่และทำให้ชุดข้อมูลนั้นสามารถเข้าถึงได้ มีเหตุผลที่จะสงสัยว่าทำไมสิ่งนี้จึงเกิดขึ้น และพิจารณาว่าอาจเป็นเพราะบริษัทที่สร้างขึ้นต้องการ ‘ล้าง’ โมเดลที่ไม่เป็นมิตรต่อ IP สำหรับการใช้งานของตนเอง หรือว่า ‘ชุดข้อมูลที่ล้าง’ ถูกขอจากภายนอก

กรณีหนึ่งของ ‘การล้างรุ่น’ คือ Omni-VFX dataset ซึ่งรวมจุดข้อมูลหลายจุดจาก Open-VFX dataset (ซึ่งอ้างอิงแพลตฟอร์มที่ปิดและกึ่งปิดหลายแห่ง เช่น Pika และ PixVerse) ให้

เพื่อความจริงจัง Omni-VFX ไม่ได้พยายามซ่อนเร้น:

ใน Omni-VFX ชุดข้อมูลที่เปิดกว้าง มีหน้าตาหนึ่งที่คุ้นเคย

ใน Omni-VFX ชุดข้อมูลที่เปิดกว้าง มีหน้าตาหนึ่งที่คุ้นเคย แหล่งที่มา

ความรับผิดชอบต่อบรรพบุรุษ

วิธีการหลักในการ ‘ล้าง IP’ คือการใช้ข้อมูลที่มีลิขสิทธิ์ที่หลายขั้นตอนหรือหลายขั้นตอน หนึ่งในวิธีการในหมวดหมู่นี้คือการใช้ ข้อมูลสังเคราะห์ ที่ได้รับการฝึกอบรมใน某จุดข้างหน้าจากข้อมูลที่มีลิขสิทธิ์ ในกรณีเหล่านี้ โดยเฉพาะอย่างยิ่งเมื่อข้อมูลสังเคราะห์สามารถให้ผลลัพธ์ที่ดูเหมือนจริงได้ ข้อมูลที่มีลิขสิทธิ์จะให้การเปลี่ยนแปลงที่ไม่สามารถเดาหรือประมาณได้ด้วยโมเดลทั่วไปหรือโมเดลที่ไม่เชี่ยวชาญ

นี่เป็นกรณีที่ชัดเจนโดยเฉพาะอย่างยิ่งเมื่อระบบวิดีโอที่สร้างสรรค์ต้องการสร้าง ‘เหตุการณ์ที่เป็นไปไม่ได้’ และเหตุการณ์ที่จะอยู่ในหมวด ‘เอฟเฟกต์ภาพ’ (VFX)

ในความเป็นจริง สิ่งที่นำหัวข้อนี้มาให้พิจารณาคือการวิจัยล่าสุดในซีรีส์ที่ให้ความสามารถในการ ‘สรุป’ ประเภทต่างๆ ของเอฟเฟกต์ภาพ เช่น การสร้างเลเซอร์จากส่วนต่างๆ ของร่างกายที่ไม่น่าจะเป็นไปได้ โดยการฝึกอบรมจากคลิป VFX ที่สั่งทำหรือ ‘เปิดกว้าง’ (แทนที่จะเป็นแหล่งที่มาที่ชัดเจน เช่น คลิป VFX ที่มีราคาแพงจากจักรวาลภาพยนตร์ Marvel):

ตัวอย่างจากเว็บไซต์ EffectMaker ซึ่ง ‘การกระทำ’ ในคลิปต้นฉบับ (ทางซ้าย) ถูกนำไปใช้กับภาพต้นฉบับ (ตรงกลาง) แหล่งที่มา

ตัวอย่างเหล่านี้มาจาก หน้าโครงการ ของ EffectMaker EffectMaker ไม่ใช่การนำเสนอครั้งแรกในปีนี้ที่พยายามดึงเอฟเฟกต์ VFX ออกจากคลิปวิดีโอหนึ่งและย้ายไปคลิปอื่น และในความเป็นจริงสิ่งนี้กำลังจะกลายเป็นงานย่อยในงานวิจัย AI VFX*

รู้ว่าบริษัทสื่อขนาดใหญ่ เช่น Marvel มีโอกาสชนะคดีทางกฎหมายเกี่ยวกับทรัพย์สินทางปัญญา (แม้ในสภาพแวดล้อม ‘การอดทนบังคับ’ เช่นนี้) บริษัทเอฟเฟกต์ภาพและสตาร์ทอัพกำลังพยายามอย่างมากเพื่อให้แน่ใจว่าเฟรมเวิร์กเอฟเฟกต์ภาพที่สร้างสรรค์ของตนเองไม่มี IP ของบริษัทอื่น

สิ่งสำคัญที่สุดในหมู่นี้คือ Meta ซึ่งได้รับการรายงาน ใน r/vfx subreddit ที่ได้ทำการรับสมัครในช่วงฤดูหนาวที่มีเงินตอบแทนสูงในปี 2026 โดยเสนอให้นักศิลปะ VFX ทำงานฝึกอบรมโมเดล AI เพื่อสร้างภาพเอฟเฟกต์ภาพระดับฮอลลีวูด แม้ว่าเงินตอบแทนที่ไม่ได้ระบุไว้ในโพสต์หลายแห่ง แต่หนึ่งใน อธิบายว่าเป็น ‘เงินเกษียณ’

ติดตามเงิน

อย่างไรก็ตาม ต้องสงสัยว่าแม้แต่บริษัทอย่าง Meta ก็ยินดีจ่ายเงินเท่าใดสำหรับความหลากหลายและความอุดมสมบูรณ์ของภาพเอฟเฟกต์ VFX ที่สั่งทำ โดยเฉพาะอย่างยิ่งเมื่อราคาเฉลี่ยของภาพเอฟเฟกต์ VFX เพียงภาพเดียวสำหรับภาพยนตร์บล็อกบัสเตอร์อยู่ที่ 42,000 ดอลลาร์สหรัฐฯ – และหลายภาพมีราคาแพงกว่านั้นมาก

นอกจากนี้ ยังสมเหตุสมผลที่จะคิดว่าโมเดล AI ที่สร้าง VFX ที่สั่งทำจะยอมจำนนต่อความต้องการที่ได้รับความนิยม รวมถึงเอฟเฟกต์มาตรฐานต่างๆ จากประเภทภาพยนตร์ที่มีราคาแพงและได้รับความนิยมมากที่สุด

นอกจากมุมมองที่ว่า ‘นักศิลปะ VFX ที่เหลือ’ อาจสร้างภาพที่พวกเขาทำงานในแคตตาล็อกภาพยนตร์ที่มีอยู่แล้ว – ซึ่งทำให้การทำงาน ‘สั่งทำ’ มีลักษณะเหมือนกัน – ก็ไม่มีการรับประกันว่า

นักเขียนด้านการเรียนรู้ของเครื่องจักร ผู้เชี่ยวชาญด้านสังเคราะห์ภาพมนุษย์ อดีตหัวหน้าฝ่ายวิจัยเนื้อหาที่ Metaphysic.ai