Một thẩm phán liên bang đã đưa ra phán quyết có lợi cho Anthropic trong một vụ kiện bản quyền lớn, tuyên bố rằng các nhà phát triển trí tuệ nhân tạo (AI) có thể sử dụng sách đã xuất bản để huấn luyện mô hình mà không cần sự đồng ý của tác giả. Quyết định này được đưa ra vào thứ Hai tại Tòa án Quận Hoa Kỳ cho Quận Bắc California, tạo ra một tiền lệ quan trọng rằng việc huấn luyện các hệ thống AI trên các tác phẩm có bản quyền cấu thành ‘sử dụng hợp lý’. Mặc dù phán quyết này không đảm bảo rằng các tòa án khác sẽ tuân theo, nhưng quyết định của Thẩm phán William Alsup là trường hợp đầu tiên trong hàng chục vụ kiện bản quyền đang diễn ra đưa ra câu trả lời về ‘sử dụng hợp lý’ trong bối cảnh AI tạo sinh.
Vấn đề này đã được đặt ra bởi những người sáng tạo trong nhiều ngành công nghiệp kể từ khi các công cụ AI tạo sinh bùng nổ, cho phép người dùng dễ dàng tạo ra tác phẩm nghệ thuật từ các mô hình được huấn luyện trên tác phẩm có bản quyền mà không có sự cho phép hoặc thậm chí là kiến thức của người sáng tạo. Các công ty AI đã phải đối mặt với một loạt các vụ kiện bản quyền từ các công ty truyền thông, hãng thu âm và tác giả kể từ năm 2023. Các nghệ sĩ đã ký nhiều thư ngỏ kêu gọi các quan chức chính phủ và nhà phát triển AI hạn chế việc sử dụng trái phép các tác phẩm có bản quyền.
Thẩm phán Alsup đã đưa ra phán quyết về một vụ kiện do ba tác giả – Andrea Bartz, Charles Graeber và Kirk Wallace Johnson – đệ trình vào tháng 8, cáo buộc rằng Anthropic đã phớt lờ các biện pháp bảo vệ bản quyền khi sao chép hàng triệu cuốn sách và số hóa sách đã mua để đưa vào các mô hình ngôn ngữ lớn của mình, giúp huấn luyện chúng tạo ra các phản hồi văn bản giống như con người.
Trong phán quyết của mình, Thẩm phán Alsup viết: “Các bản sao được sử dụng để huấn luyện LLM cụ thể được chứng minh là một hành vi sử dụng hợp lý. Mọi yếu tố, ngoại trừ bản chất của tác phẩm có bản quyền, đều ủng hộ kết quả này. Công nghệ đang được đề cập là một trong những công nghệ mang tính biến đổi nhất mà nhiều người trong chúng ta sẽ thấy trong đời.” Ông nói thêm rằng việc Anthropic sử dụng sách để huấn luyện các mô hình của mình, bao gồm cả các phiên bản của mô hình AI hàng đầu Claude, là “cực kỳ biến đổi” đủ để thuộc phạm vi sử dụng hợp lý.
Theo Đạo luật Bản quyền, ‘sử dụng hợp lý’ xem xét bốn yếu tố: mục đích sử dụng, loại tác phẩm có bản quyền được sử dụng (tác phẩm sáng tạo được bảo vệ mạnh mẽ hơn tác phẩm thực tế), lượng tác phẩm được sử dụng và liệu việc sử dụng có gây tổn hại đến giá trị thị trường của tác phẩm gốc hay không.
Anthropic cho biết trong một tuyên bố: “Chúng tôi rất vui mừng khi Tòa án công nhận rằng việc sử dụng ‘các tác phẩm để huấn luyện LLM là mang tính biến đổi – đặc biệt như vậy’, trích dẫn phán quyết. “Phù hợp với mục đích của bản quyền là tạo điều kiện cho sự sáng tạo và thúc đẩy tiến bộ khoa học, ‘LLM của Anthropic được huấn luyện dựa trên các tác phẩm không phải để chạy đua và sao chép hoặc thay thế chúng – mà là để rẽ một bước ngoặt khó khăn và tạo ra một thứ gì đó khác biệt’.”
Thẩm phán Alsup cho biết tất cả các tác phẩm của các tác giả đều chứa “các yếu tố biểu cảm” giúp chúng được bảo vệ bản quyền mạnh mẽ hơn, đây là một yếu tố chống lại việc sử dụng hợp lý, mặc dù không đủ để ảnh hưởng đến phán quyết chung. Ông nói thêm rằng trong khi việc tạo bản sao kỹ thuật số của sách đã mua là sử dụng hợp lý, thì việc tải xuống các bản sao lậu miễn phí không phải là sử dụng hợp lý.
Ngoài hàng triệu bản sao lậu, Thẩm phán Alsup viết, việc sao chép toàn bộ tác phẩm để huấn luyện các mô hình AI là “đặc biệt hợp lý” vì các mô hình không tái tạo các bản sao đó để công chúng truy cập và vì việc này “đã không và sẽ không làm mất nhu cầu” đối với sách gốc. Phán quyết của ông nói rằng mặc dù các nhà phát triển AI có thể hợp pháp huấn luyện các mô hình AI trên các tác phẩm có bản quyền mà không được phép, nhưng họ nên lấy những tác phẩm đó thông qua các phương tiện hợp pháp, không liên quan đến việc sao chép lậu hoặc các hình thức trộm cắp khác.
Theo NBC News, mặc dù đứng về phía công ty AI về sử dụng hợp lý, Thẩm phán Alsup viết rằng Anthropic vẫn sẽ phải đối mặt với phiên tòa vì các bản sao lậu mà họ đã sử dụng để tạo ra thư viện sách trung tâm khổng lồ được sử dụng để huấn luyện AI. Ông viết: “Việc Anthropic sau đó mua một bản sao của cuốn sách mà họ đã đánh cắp trước đó trên internet sẽ không giải phóng họ khỏi trách nhiệm pháp lý đối với hành vi trộm cắp, nhưng nó có thể ảnh hưởng đến mức độ bồi thường thiệt hại theo luật định”.