Một thẩm phán liên bang tại New York đã ra phán quyết rằng OpenAI phải cung cấp tất cả các thông tin nội bộ với các luật sư của mình về lý do công ty này xóa hai kho sách khổng lồ từ một thư viện “bóng tối” nổi tiếng, mà OpenAI bị cáo buộc đã sử dụng để huấn luyện ChatGPT.
Thẩm phán Ona Wang đã đưa ra quyết định này vào thứ Hai, cho rằng các lý do thay đổi của OpenAI về việc xóa dữ liệu đã làm mất hiệu lực bất kỳ lập luận nào cho rằng những lý do đó có thể được bảo vệ bởi đặc quyền luật sư-khách hàng.
“OpenAI tiếp tục khẳng định rằng họ không vi phạm bản quyền các tác phẩm của nguyên đơn một cách cố ý,” Wang viết trong quyết định dài 28 trang của mình. “Một bồi thẩm đoàn có quyền biết cơ sở cho ý định thiện chí được cho là của OpenAI. Điều quan trọng là OpenAI đã đưa trạng thái tinh thần của mình vào vấn đề, và OpenAI không thể tùy tiện sử dụng đặc quyền luật sư-khách hàng để hạn chế sự điều tra của Nguyên đơn về bằng chứng liên quan đến ý định thiện chí được cho là của OpenAI theo cách này.”
Vị thẩm phán này đang giám sát một vụ kiện tập thể lớn chống lại Microsoft và OpenAI, bao gồm cả tờ Daily News và các tờ báo liên kết, những đơn vị cáo buộc gã khổng lồ công nghệ này vi phạm bản quyền.
Quyết định của Thẩm phán Wang tập trung vào một nhóm nguyên đơn bao gồm Hiệp hội Tác giả và một danh sách dài các nhà văn bán chạy nhất. Họ cáo buộc OpenAI đã sử dụng các cuốn sách bị đánh cắp từ thư viện trực tuyến “LibGen” khét tiếng để huấn luyện các sản phẩm AI của mình, sau khi một nhân viên tải chúng xuống vào năm 2018.
Trong quá trình khám phá bằng chứng, các nguyên đơn phát hiện ra rằng OpenAI đã xóa hai kho dữ liệu, được gọi là “Books1” và “Books2”, vào năm 2022 – một năm trước khi bất kỳ vụ kiện nào bắt đầu. Các kho này được cho là chứa hơn 100.000 cuốn sách.
“Tại thời điểm đó, OpenAI khẳng định rằng các tập dữ liệu đã bị xóa do ‘không sử dụng’. Đây là những tập dữ liệu huấn luyện duy nhất mà theo OpenAI, đã từng bị xóa,” Wang viết. “Sau đó, khi Nguyên đơn tìm kiếm bằng chứng về lý do xóa các tập dữ liệu Books1 và Books2, OpenAI đã khẳng định đặc quyền luật sư-khách hàng. Lập trường của OpenAI về việc liệu lý do xóa có được đặc quyền hay không đã thay đổi vài lần.”
Thẩm phán Wang yêu cầu OpenAI cung cấp cho các nguyên đơn các thông tin liên lạc mà bà đã xem xét, tất cả các thông tin liên lạc bằng văn bản khác với các luật sư nội bộ của công ty về lý do các tập dữ liệu bị xóa, và tất cả các tham chiếu nội bộ đến LibGen mà OpenAI trước đây đã biên tập hoặc giữ lại.
Các nhóm pháp lý của Hiệp hội Tác giả và OpenAI đã không trả lời ngay lập tức các yêu cầu bình luận. Một phát ngôn viên của OpenAI nói với Law360: “Chúng tôi không đồng ý với phán quyết và có ý định kháng cáo.” Tin tức này được báo cáo bởi New York Daily News.







































