Mạng xã hội Reddit đang phải đối mặt với tình trạng bị các bot AI (trí tuệ nhân tạo) tấn công tràn lan, và CEO Steve Huffman thừa nhận công ty đang trong cuộc “chạy đua vũ trang” để phát hiện và ngăn chặn các bài đăng giả mạo này. Điều trớ trêu là, nguyên nhân dẫn đến tình trạng này lại xuất phát từ chính quyết định bán quyền truy cập dữ liệu người dùng cho các công ty AI để huấn luyện mô hình của Reddit.
Mọi chuyện bắt đầu từ năm ngoái, khi Reddit ký một thỏa thuận trị giá 60 triệu USD cho phép thu thập dữ liệu người dùng để huấn luyện AI. Google được cho là một trong những đối tác chính trong thỏa thuận này. Để bảo vệ thỏa thuận, Reddit đã bắt đầu hạn chế quyền truy cập của các công ty khác, bao gồm cả các trình thu thập dữ liệu web, chỉ cho phép Google được lập chỉ mục trang web của họ.
Hậu quả của việc này là các công ty, đặc biệt là các đại lý quảng cáo, đã tìm cách tận dụng Reddit để quảng bá sản phẩm và thương hiệu của mình trên các chatbot AI. Họ sử dụng bot AI để tạo ra các bài đăng giả mạo, với hy vọng nội dung này sẽ được các chatbot AI sử dụng lại trong phản hồi của chúng. Theo Financial Times, nhiều giám đốc điều hành của các đại lý quảng cáo đã thừa nhận việc này.
Ông Huffman cho biết: “Trong 20 năm, chúng tôi đã chiến đấu với những người muốn trở nên phổ biến trên Reddit. Chúng tôi lập chỉ mục rất tốt vào các công cụ tìm kiếm. Nếu bạn muốn xuất hiện trên các công cụ tìm kiếm, bạn cố gắng hoạt động tốt trên Reddit, và bây giờ với các LLM (mô hình ngôn ngữ lớn), cũng tương tự. Nếu bạn muốn có mặt trong các LLM, bạn có thể làm điều đó thông qua Reddit.”
Reddit đang nỗ lực tìm kiếm các giải pháp mới để giải quyết vấn đề này, bao gồm cả việc xem xét công nghệ quét nhãn cầu của OpenAI. Tuy nhiên, theo 9to5Mac, vấn đề này hoàn toàn do chính Reddit tạo ra, khi người dùng vốn đã không hài lòng về việc dữ liệu của họ bị bán để huấn luyện AI, giờ lại phải đối mặt với tình trạng spam tràn lan do chính thỏa thuận đó gây ra.