Hai tác giả, Grady Hendrix và Jennifer Robertson, đã đệ đơn kiện tập thể tại tòa án liên bang ở Bắc California, cáo buộc Apple sử dụng một bộ dữ liệu sách bị đánh cắp bản quyền để huấn luyện các mô hình trí tuệ nhân tạo (AI) của mình. Theo đơn kiện, Apple đã sử dụng bộ dữ liệu có tên Books3, chứa các tác phẩm đã xuất bản của họ và nhiều tác giả khác, để huấn luyện mô hình ngôn ngữ OpenELM.
Cáo buộc này dựa trên thông tin được Apple công bố trong một bài báo về OpenELM, một mô hình mã nguồn mở mà công ty phát hành năm ngoái. Bài báo này đề cập đến RedPajama như một trong những bộ dữ liệu được sử dụng, và RedPajama lại dựa vào Books3, vốn được cho là “một kho sách bị đánh cắp bản quyền”.
Các tác giả yêu cầu tòa án cho phép vụ kiện tiến hành dưới hình thức kiện tập thể và đòi bồi thường thiệt hại, đồng thời yêu cầu Apple ngừng các hành vi vi phạm và tiêu hủy các mô hình AI cũng như bộ dữ liệu huấn luyện có chứa tác phẩm của họ.
Vụ kiện này diễn ra sau khi Anthropic, một công ty AI khác, phải dàn xếp với các tác giả với số tiền lên tới 1,5 tỷ USD vì lý do tương tự. Trong khi đó, Meta lại thắng kiện trong một vụ việc tương tự khi tòa án phán quyết việc sử dụng sách để huấn luyện AI thuộc phạm vi “sử dụng hợp lý” (fair use).
Gần đây, Tổng Thống Donald Trump cũng bày tỏ quan điểm rằng việc yêu cầu bồi thường cho mọi tài liệu được AI học hỏi là không khả thi và có thể cản trở sự phát triển của AI. Vụ kiện này đặt ra câu hỏi quan trọng về bản quyền và đạo đức trong kỷ nguyên AI.
Theo tin từ Reuters ngày 05/09/2025.