Trí tuệ nhân tạo

Trí tuệ nhân tạo vs. Tác giả: Tại sao các vụ kiện bản quyền chỉ là bước khởi đầu

mm
AI vs. Authors: Why Copyright Lawsuits Are Just the Beginning

Trí tuệ nhân tạo tạo sinh đã thay đổi đáng kể thế giới kỹ thuật số. Nó cho phép bất kỳ ai tạo văn bản, hình ảnh và các hình thức truyền thông khác một cách nhanh chóng và dễ dàng. Tiến bộ này dựa trên các tập dữ liệu lớn, bao gồm sách, bài viết, trang web và các tác phẩm sáng tạo khác. Những tập dữ liệu này đào tạo Mô hình ngôn ngữ lớn (LLM) để viết, suy luận và tạo nội dung giống như sự sáng tạo của con người.

Tuy nhiên, sức mạnh này cũng đã gây ra sự bất đồng đáng kể. Các tác giả, nghệ sĩ và nhà xuất bản đang ngày càng thách thức các công ty công nghệ phát triển những hệ thống này. Họ cho rằng tác phẩm bản quyền của họ đã được sử dụng mà không có sự đồng ý hoặc thanh toán. Tòa án đã trở thành nơi chính để giải quyết tranh chấp về quyền sở hữu sáng tạo và giới hạn bản quyền.

Các vụ kiện này không chỉ liên quan đến tiền bạc hoặc tín dụng. Chúng là bước khởi đầu của một cuộc tranh luận rộng lớn hơn về đạo đức của trí tuệ nhân tạo và trách nhiệm của các công ty đào tạo những mô hình này. Kết quả sẽ ảnh hưởng đến cả quyền của người tạo ra và cách xã hội định nghĩa sự sáng tạo và sở hữu trong thời đại của máy móc.

Vấn đề này phản ánh sự căng thẳng ngày càng tăng giữa tiến bộ công nghệ và nhu cầu bảo vệ. Trí tuệ nhân tạo tạo sinh cung cấp cơ hội mới cho sự sáng tạo và hợp tác. Tuy nhiên, nó cũng gây ra lo ngại về công bằng, đồng ý và sử dụng công việc của con người trong đào tạo máy móc. Các quyết định pháp lý sắp tới sẽ đóng vai trò quan trọng trong việc xác định ai kiểm soát nội dung sáng tạo trong thời đại công nghệ mới này.

Làm thế nào Trí tuệ nhân tạo tạo sinh sử dụng nội dung bản quyền

Để hiểu các tranh chấp pháp lý hiện tại, điều quan trọng là phải biết cách các hệ thống trí tuệ nhân tạo tạo sinh được đào tạo. Các mô hình như ChatGPT, ClaudeStable Diffusion học từ các tập dữ liệu lớn bao gồm văn bản, hình ảnh và các nội dung kỹ thuật số khác thu thập từ Internet. Bằng cách nghiên cứu những tài liệu này, chúng nhận ra các mẫu ngôn ngữ, phong cách nghệ thuật và mối quan hệ giữa từ và ý tưởng. Quá trình này cho phép chúng tạo ra nội dung mới giống như được tạo ra bởi con người.

Tuy nhiên, một phần đáng kể của dữ liệu đào tạo này bao gồm tài liệu bản quyền, bao gồm sách, bài viết, bài báo khoa học, bài hát và tác phẩm nghệ thuật. Phần lớn trong số này được thu thập mà không có sự đồng ý trực tiếp của các tác giả gốc. Các tập dữ liệu như Books3, The PileCommon Crawl, thường được gọi là thư viện bóng tối, đã thường được liên kết với đào tạo trí tuệ nhân tạo. Những bộ sưu tập này chứa hàng triệu tác phẩm giúp các hệ thống trí tuệ nhân tạo học cách viết, vẽ hoặc sáng tác theo cách giống con người.

Thực tiễn này đã trở nên rất gây tranh cãi. Nhiều nhà văn và nghệ sĩ cho rằng nó tương đương với việc thu thập dữ liệu lớn mà không có sự công nhận hoặc thanh toán. Họ tin rằng nó không công bằng khi các công ty công nghệ được hưởng lợi trong khi giá trị của sự sáng tạo con người bị suy giảm. Mặt khác, các nhà phát triển trí tuệ nhân tạo cho rằng việc sử dụng tài liệu như vậy là hợp pháp theo nguyên tắc sử dụng hợp lý. Họ so sánh việc học máy với cách con người học bằng cách đọc và quan sát thế giới xung quanh.

Sự không đồng thuận này đã kích hoạt một trong những cuộc tranh luận quan trọng nhất về việc liệu đào tạo trí tuệ nhân tạo trên các tác phẩm bản quyền có nên được coi là sáng tạo hay xâm phạm bản quyền. Kết quả của cuộc tranh luận này sẽ định hình cách các xã hội cân bằng giữa sự sáng tạo con người và sự ảnh hưởng ngày càng tăng của trí tuệ nhân tạo.

Các vụ kiện bản quyền trí tuệ nhân tạo lớn và tác động pháp lý của chúng

Các vụ kiện gần đây cho thấy cuộc tranh luận về trí tuệ nhân tạo và bản quyền đang chuyển từ thảo luận lý thuyết sang hành động pháp lý thực tế. Các tác giả và nghệ sĩ đang kiện các công ty trí tuệ nhân tạo để bảo vệ công việc của họ. Những vụ kiện này liên quan đến việc liệu các hệ thống trí tuệ nhân tạo có sao chép sách, hình ảnh hoặc các hình thức nội dung sáng tạo khác mà không có sự cho phép. Tòa án hiện yêu cầu bằng chứng rõ ràng về việc sao chép, điều này hạn chế các khiếu nại có thể thành công. Mỗi vụ kiện nhấn mạnh các khía cạnh khác nhau của luật pháp và đặt ra câu hỏi về cách quyền của người tạo ra được tôn trọng trong thời đại trí tuệ nhân tạo.

Tremblay v. OpenAI

Các nhà văn Mona Awad và Paul Tremblay cho rằng OpenAI đã sử dụng sách của họ mà không có sự cho phép để đào tạo ChatGPT. Họ lập luận rằng tóm tắt của ChatGPT về các tiểu thuyết của họ cho thấy vi phạm bản quyền. Họ cũng cho rằng OpenAI đã vi phạm DMCA bằng cách xóa thông tin bản quyền.

Vào tháng 3 năm 2024, Thẩm phán Araceli Martínez-Olguín đã bác bỏ hầu hết các khiếu nại, bao gồm cả những khiếu nại theo DMCA, sơ suất và làm giàu bất công, vì các nguyên đơn không thể chứng minh các đoạn văn bản được sao chép cụ thể. Một khiếu nại nhỏ về vi phạm bản quyền trực tiếp vẫn được cho phép. Các nguyên đơn phải chứng minh rằng đầu ra của ChatGPT tương tự như sách của họ.

Authors Guild v. OpenAI và Microsoft

Vào tháng 9 năm 2023, Authors Guild và 17 tác giả, bao gồm George R.R. Martin, John Grisham, Jonathan Franzen và Jodi Picoult, đã đệ trình một vụ kiện tập thể ở New York. Họ cho rằng OpenAI và Microsoft đã sao chép hàng triệu sách, thường từ các trang web pirate, để đào tạo mô hình trí tuệ nhân tạo mà không có sự cho phép.

Đơn khiếu nại cũng nhấn mạnh hiệu ứng thay thế thị trường, cho rằng người đọc có thể sử dụng trí tuệ nhân tạo để tạo nội dung thay vì mua tác phẩm gốc. Microsoft trở thành bị đơn vào tháng 12 năm 2023. Vụ kiện vẫn đang diễn ra, chưa có phán quyết quan trọng nào.

Bartz v. Anthropic

Vào tháng 10 năm 2023, các tác giả Andrea Bartz, Charles Graeber và Kirk Wallace Johnson đã kiện Anthropic, nhà tạo ra Claude AI. Họ cho rằng Anthropic đã sử dụng các tập dữ liệu pirate, bao gồm Books3, LibGen và Pirate Library Mirror, để đào tạo mô hình của mình.

Vào tháng 6 năm 2025, Thẩm phán William Alsup đã phán quyết rằng đào tạo trên sách được thu thập một cách hợp pháp có thể được coi là sử dụng hợp lý, nhưng đào tạo trên sách pirate thì không. Vào tháng 9 năm 2025, Anthropic đã đồng ý với một thỏa thuận 1,5 tỷ đô la bao gồm khoảng 500.000 tác phẩm. Đây là một trong những thỏa thuận bản quyền lớn nhất trong lịch sử Hoa Kỳ.

Andersen v. Stability AI

Vào tháng 1 năm 2023, các nghệ sĩ Sarah Andersen, Karla Ortiz và Kelly McKernan đã kiện Stability AI, Midjourney và DeviantArt. Họ cho rằng hàng triệu hình ảnh đã được sao chép mà không có sự cho phép để đào tạo mô hình trí tuệ nhân tạo tạo hình ảnh từ văn bản.

Các khiếu nại của họ bao gồm vi phạm bản quyền, vi phạm DMCA, làm giàu bất công và giả mạo, lập luận rằng đầu ra của trí tuệ nhân tạo đã sao chép phong cách nghệ thuật của họ. Vào tháng 8 năm 2024, Thẩm phán William Orrick đã bác bỏ các khiếu nại theo DMCA nhưng cho phép các khiếu nại về vi phạm bản quyền trực tiếp và khuyến khích tiếp tục. Vụ kiện vẫn đang diễn ra.

Những vụ kiện này cho thấy cách tòa án đang bắt đầu định nghĩa ranh giới pháp lý cho đào tạo trí tuệ nhân tạo. Kết quả sẽ ảnh hưởng đến cả người tạo ra và nhà phát triển trí tuệ nhân tạo, ảnh hưởng đến cách nội dung sáng tạo được sử dụng trong học máy trong tương lai.

Khu vực xám của trí tuệ nhân tạo và bản quyền

Câu hỏi lớn trong các vụ kiện bản quyền trí tuệ nhân tạo là liệu việc sử dụng tác phẩm sáng tạo mà không có sự cho phép là công bằng hay không. Nguyên tắc sử dụng hợp lý cho phép sử dụng hạn chế tài liệu bản quyền cho mục đích như nghiên cứu, giáo dục hoặc phê bình. Nhưng áp dụng nó vào trí tuệ nhân tạo là phức tạp. Các mô hình như ChatGPT hoặc Stable Diffusion sao chép, phân tích và học từ hàng triệu tác phẩm. Điều này rất khác với cách con người sử dụng nội dung, và nó đặt ra những thách thức pháp lý mới. Bốn điểm thường được sử dụng để đánh giá sử dụng hợp lý:

  • Mục đích và đặc điểm: Việc đào tạo trí tuệ nhân tạo có thực sự tạo ra điều gì đó mới, hay chỉ sao chép trên quy mô lớn?
  • Bản chất của tác phẩm: Các tài liệu có phải là事 thực hay rất sáng tạo?
  • Số lượng và tính chất quan trọng: Bao nhiêu tác phẩm được sử dụng, và liệu nó có lấy đi phần quan trọng của tác phẩm gốc?
  • Tác động đến thị trường: Trí tuệ nhân tạo có làm giảm doanh số hoặc giá trị của tác phẩm gốc?

Các công ty trí tuệ nhân tạo cho rằng đào tạo là chuyển đổi. Họ nói rằng các mô hình không đọc như con người. Thay vào đó, chúng phát hiện ra các mẫu và tái kết hợp chúng theo cách mới. Họ so sánh điều này với cách con người học từ việc đọc hoặc quan sát. Các nhà phê bình đặt câu hỏi về điều này. Khi trí tuệ nhân tạo có thể sao chép phong cách của một tác giả hoặc chữ ký của một nghệ sĩ, đầu ra có thể thay thế tác phẩm gốc trên thị trường. Sau đó, rất khó để gọi nó chỉ là việc học.

Một vấn đề khác là luật bản quyền được viết cho con người, không phải máy móc. Tòa án hiện đang buộc phải quyết định liệu việc sao chép cho trí tuệ nhân tạo có được coi là học hỏi hay xâm phạm bản quyền. Có rất ít tiền lệ. Điều này có nghĩa là các thẩm phán phải xem xét lại các khái niệm cơ bản về sự sáng tạo, quyền tác giả và những gì cấu thành một tác phẩm phái sinh.

Một số chuyên gia đề xuất tạo ra các hệ thống cấp phép cho trí tuệ nhân tạo. Các chủ sở hữu quyền có thể cho phép tác phẩm của họ được sử dụng trong đào tạo để đổi lấy thanh toán. Điều này sẽ tương tự như cấp phép âm nhạc hoặc nhiếp ảnh trong thời đại kỹ thuật số. Những hệ thống như vậy có thể cân bằng giữa công bằng, bồi thường và đổi mới – nhưng chúng cũng thách thức giả định rằng sử dụng hợp lý alone là đủ để quản lý đào tạo trí tuệ nhân tạo.

Cuộc tranh luận không chỉ là pháp lý. Nó đặt ra một câu hỏi sâu sắc hơn: liệu các công ty trí tuệ nhân tạo có nên được phép sử dụng sự sáng tạo của con người một cách tự do, hay các tác giả nên giữ quyền kiểm soát cách công việc của họ được sử dụng để dạy máy móc? Câu trả lời sẽ định hình tương lai của cả trí tuệ nhân tạo và quyền sáng tạo của con người.

Kích thước đạo đức và toàn cầu của cuộc tranh luận bản quyền trí tuệ nhân tạo

Cuộc thảo luận về trí tuệ nhân tạo và bản quyền mở rộng ra ngoài pháp lý. Nó cũng liên quan đến các vấn đề đạo đức và toàn cầu. Câu hỏi chính là liệu có chấp nhận được khi máy móc được hưởng lợi từ sự sáng tạo của con người mà không có sự cho phép hoặc bồi thường.

Đối với nhiều tác giả và nghệ sĩ, vấn đề này không phải là lý thuyết. Trí tuệ nhân tạo tạo sinh hiện có thể sản xuất câu chuyện, hình ảnh và bài viết cạnh tranh với công việc của con người. Điều này làm giảm thu nhập tiềm năng và làm suy yếu quyền kiểm soát sáng tạo. Lo lắng là rằng nhiều dữ liệu đào tạo cho những hệ thống này bao gồm tài liệu bản quyền được thu thập mà không có sự cho phép. Điều này đặt ra các câu hỏi đạo đức về quyền sở hữu và tôn trọng lao động trí tuệ.

Từ góc độ đạo đức, những thực tiễn như vậy giống như một hình thức khai thác dữ liệu, nơi ý tưởng và biểu đạt của con người được đối xử như các tài nguyên miễn phí cho các công ty công nghệ lớn. Những công ty này thu được giá trị từ công việc sáng tạo của các cá nhân nhưng thường không cung cấp tín dụng hoặc thanh toán để đổi lấy. Sự mất cân bằng này làm tăng khoảng cách giữa các ngành công nghệ toàn cầu và các nhà sáng tạo độc lập.

Cũng có một mối quan tâm về văn hóa. Khi các hệ thống trí tuệ nhân tạo tái sử dụng tài liệu hiện có, chúng có thể hạn chế sự sáng tạo và đa dạng trong sản xuất sáng tạo. Internet có nguy cơ trở nên đầy rẫy các nội dung lặp lại, giảm không gian cho sự đổi mới và giọng nói độc đáo. Do đó, cuộc tranh luận đạo đức cũng bao gồm cách trí tuệ nhân tạo có thể ảnh hưởng đến chất lượng và hướng đi của sự sáng tạo toàn cầu.

Đồng thời, vấn đề về công bằng trong đào tạo trí tuệ nhân tạo đã trở thành một vấn đề chính sách toàn cầu. Mặc dù hầu hết các vụ kiện pháp lý đang diễn ra tại Hoa Kỳ, nhưng những phát triển tương tự đang xuất hiện ở các khu vực khác. Tại Ấn Độ, các tổ chức truyền thông đã thách thức việc sử dụng nội dung tin tức của họ bởi các công ty trí tuệ nhân tạo. Luật Trí tuệ nhân tạo của Liên minh Châu Âu giới thiệu các yêu cầu minh bạch nghiêm ngặt, yêu cầu các công ty tiết lộ các tập dữ liệu họ sử dụng cho các ứng dụng trí tuệ nhân tạo. Vương quốc Anh đang xem xét lại chính sách về khai thác dữ liệu và văn bản, trong khi Nhật Bản đã áp dụng một cách tiếp cận cởi mở hơn, cho phép sử dụng dữ liệu rộng rãi hơn để thúc đẩy đổi mới.

Những vị trí tương phản này cho thấy không có sự đồng thuận toàn cầu về việc cân bằng giữa sự sáng tạo và tiến bộ công nghệ. Một số quốc gia ủng hộ việc bảo vệ các nhà sáng tạo, trong khi những quốc gia khác tập trung vào việc thúc đẩy đổi mới. Một khuôn khổ quốc tế chung, chẳng hạn như một hệ thống cấp phép hoặc đăng ký, có thể giúp quản lý sự đồng ý và bồi thường một cách công bằng hơn. Tương lai của trí tuệ nhân tạo và bản quyền sẽ phụ thuộc vào việc liệu những biện pháp phối hợp như vậy có thể đảm bảo cả quyền sáng tạo và sự phát triển công nghệ có trách nhiệm.

Các bước tiếp theo cho sử dụng hợp lý và quyền sáng tạo trong kỷ nguyên trí tuệ nhân tạo

Ngay cả khi các công ty trí tuệ nhân tạo thắng trong các vụ kiện hiện tại, cuộc tranh luận rộng lớn hơn về công bằng và quyền sở hữu trí tuệ sẽ vẫn tiếp tục. Các nhà lập pháp và lãnh đạo ngành đang làm việc trên các quy tắc mới để làm cho đào tạo trí tuệ nhân tạo minh bạch và có trách nhiệm hơn. Cả tại Hoa Kỳ và Liên minh Châu Âu, các cải cách được đề xuất nhằm mục đích cho phép các nhà sáng tạo có nhiều quyền kiểm soát hơn đối với cách công việc của họ được sử dụng.

Một đề xuất lớn là yêu cầu các nhà phát triển trí tuệ nhân tạo tiết lộ chính xác nguồn gốc của dữ liệu đào tạo của họ. Điều này sẽ chỉ ra liệu các tác phẩm bản quyền có được bao gồm mà không có sự cho phép. Một ý tưởng khác là tạo ra các hệ thống opt-out, cho phép các tác giả và nghệ sĩ loại trừ nội dung của họ khỏi các tập dữ liệu trí tuệ nhân tạo. Một số nhà hoạch định chính sách cũng đề xuất việc tạo ra các sổ đăng ký tập dữ liệu hoặc các nền tảng cấp phép tương tự như những nền tảng được sử dụng trong ngành âm nhạc. Những hệ thống như vậy có thể giúp theo dõi việc sử dụng dữ liệu và đảm bảo bồi thường công bằng thông qua cấp phép có tổ chức.

Đồng thời, các công ty công nghệ đang phát triển các công cụ của riêng họ để thúc đẩy việc sử dụng sáng tạo một cách có đạo đức. Các phương pháp như gắn thẻ thuộc tính, đánh dấu kỹ thuật số và theo dõi blockchain có thể cho thấy khi và cách công việc của một nhà sáng tạo được sử dụng trong đào tạo hoặc đầu ra trí tuệ nhân tạo. Những giải pháp như vậy có thể giúp duy trì tính minh bạch và cho phép các nhà sáng tạo có nhiều quyền kiểm soát hơn đối với các đóng góp của họ.

Đối với các nghệ sĩ và nhà văn cá nhân, hành động cá nhân vẫn rất quan trọng. Họ nên đăng ký bản quyền, sử dụng các công cụ opt-out có sẵn và tham gia các hiệp hội nghề nghiệp ủng hộ việc đối xử công bằng.

Kết luận

Cuộc thảo luận xung quanh trí tuệ nhân tạo và bản quyền đang diễn ra và phức tạp. Trong khi tòa án giải quyết các vụ kiện cụ thể, thách thức lớn hơn là cân bằng giữa đổi mới công nghệ và bảo vệ quyền sáng tạo. Trí tuệ nhân tạo tạo sinh cung cấp những khả năng mới cho sự sáng tạo, nhưng nó dựa trên các tác phẩm được tạo ra bởi con người.

Sử dụng hợp lý, minh bạch và các khuôn khổ cấp phép là rất quan trọng để đảm bảo rằng các nhà sáng tạo nhận được sự công nhận và bồi thường. Cách những quy tắc này được phát triển sẽ định hình tương lai của các ngành công nghiệp sáng tạo và ứng dụng trí tuệ nhân tạo. Điều quan trọng là phải thiết kế các hệ thống cho phép công nghệ phát triển mà không làm tổn hại đến sự sáng tạo của con người. Bảo vệ quyền của các tác giả và nghệ sĩ sẽ giúp duy trì công bằng và hỗ trợ đổi mới bền vững trong kỷ nguyên trí tuệ nhân tạo.

Dr. Assad Abbas, một Giáo sư Liên kết có thời hạn tại Đại học COMSATS Islamabad, Pakistan, đã nhận bằng Tiến sĩ từ Đại học North Dakota State, USA. Nghiên cứu của ông tập trung vào các công nghệ tiên tiến, bao gồm điện toán đám mây, sương mù và cạnh, phân tích dữ liệu lớn và AI. Dr. Abbas đã có những đóng góp đáng kể với các ấn phẩm trên các tạp chí khoa học và hội nghị uy tín. Ông cũng là người sáng lập của MyFastingBuddy.