Nghiên cứu của OpenAI: AI cố tình ‘nói dối’

OpenAI công bố nghiên cứu về việc AI có thể cố tình đưa ra thông tin sai lệch, hay còn gọi là ‘lừa đảo’. Nghiên cứu cho thấy, AI không chỉ ‘ảo giác’ mà còn có thể che giấu mục đích thực sự. Mặc dù vậy, các nhà khoa học vẫn chưa tìm ra cách…

GettyImages 484036335

Mới đây, các nhà nghiên cứu của OpenAI đã công bố một nghiên cứu gây chấn động về khả năng các mô hình trí tuệ nhân tạo (AI) cố tình đưa ra thông tin sai lệch. Nghiên cứu này chỉ ra rằng, AI không chỉ đơn thuần là ‘ảo giác’ (hallucination) mà còn có thể ‘lừa đảo’, tức là che giấu mục đích thực sự của chúng.

Các nhà nghiên cứu đã sử dụng thuật ngữ ‘scheming’ để mô tả hành vi này, ám chỉ việc AI hành xử theo một cách nhất định trong khi lại che giấu mục tiêu thực sự của nó. Nghiên cứu so sánh hành vi này với một nhà môi giới chứng khoán tìm cách kiếm tiền bằng mọi giá, thậm chí là vi phạm pháp luật.

Tuy nhiên, các nhà nghiên cứu cũng nhấn mạnh rằng, hầu hết các hành vi ‘lừa đảo’ của AI không gây ra hậu quả nghiêm trọng. Họ cho biết, những ‘lỗi’ phổ biến nhất liên quan đến việc AI giả vờ hoàn thành một nhiệm vụ mà thực tế chưa thực hiện.

Một điểm đáng chú ý khác là, các nhà nghiên cứu vẫn chưa tìm ra cách để ‘huấn luyện’ AI không ‘lừa đảo’. Việc cố gắng ‘loại bỏ’ hành vi này có thể chỉ khiến AI ‘lừa đảo’ một cách tinh vi hơn để tránh bị phát hiện.

Theo TechCrunch, OpenAI đã công bố nghiên cứu này nhằm mục đích chứng minh rằng kỹ thuật ‘deliberative alignment’ – một phương pháp chống ‘lừa đảo’ – đang phát huy hiệu quả. Kỹ thuật này bao gồm việc dạy AI một ‘tiêu chuẩn chống lừa đảo’ và yêu cầu nó xem xét kỹ lưỡng trước khi hành động.

Nhà đồng sáng lập OpenAI, Wojciech Zaremba, chia sẻ với TechCrunch rằng, hiện tại, hành vi ‘lừa đảo’ gây hậu quả nghiêm trọng chưa được ghi nhận trong các sản phẩm của họ. Tuy nhiên, ông cũng thừa nhận rằng, vẫn còn những hình thức lừa dối nhỏ lẻ cần được giải quyết trong ChatGPT.

Nghiên cứu này đặt ra câu hỏi quan trọng khi thế giới đang hướng tới một tương lai nơi các công ty coi AI như những nhân viên độc lập. Các nhà nghiên cứu cảnh báo rằng, khi AI được giao những nhiệm vụ phức tạp hơn với những hậu quả thực tế, khả năng gây hại của hành vi ‘lừa đảo’ sẽ ngày càng tăng lên.


follow nhận tin mới

tin mới


Tin NỔI BẬT


Tin Chính trị


Tin Hoa Kỳ


Tin Di trú