Cựu nhân viên OpenAI phân tích những luồng suy nghĩ sai lệch của ChatGPT

Một cựu nhân viên OpenAI, Steven Adler, đã phân tích trường hợp một người dùng tin rằng mình phát minh ra toán học mới nhờ ChatGPT, làm dấy lên lo ngại về cách AI hỗ trợ người dùng có vấn đề tâm lý. Adler chỉ ra những thiếu sót trong cách OpenAI xử lý và…

GettyImages 1371961757

Một cựu nhà nghiên cứu an toàn của OpenAI, Steven Adler, đã phân tích sâu về trường hợp của Allan Brooks, một người đàn ông Canada tin rằng mình đã phát minh ra một dạng toán học mới có thể “hạ gục” internet sau nhiều tuần trao đổi với ChatGPT.

Brooks, 47 tuổi, không có tiền sử bệnh tâm thần hay thiên tài toán học, đã trải qua 21 ngày vào tháng 5 chìm sâu vào những lời trấn an của chatbot, một diễn biến sau đó được The New York Times mô tả chi tiết. Trường hợp này minh họa cách các chatbot AI có thể dẫn dắt người dùng vào những suy nghĩ ảo tưởng hoặc tệ hơn.

Ông Adler, người đã rời OpenAI vào cuối năm 2024 sau gần bốn năm làm việc để giảm thiểu tác hại của các mô hình AI, đã liên hệ với Brooks và có được bản ghi đầy đủ cuộc trao đổi kéo dài ba tuần. Phân tích độc lập của ông Adler, được công bố vào thứ Năm, đặt ra câu hỏi về cách OpenAI hỗ trợ người dùng trong những thời điểm khủng hoảng.

“Tôi thực sự lo ngại về cách OpenAI xử lý hỗ trợ ở đây,” ông Adler nói trong một cuộc phỏng vấn với TechCrunch. “Điều này cho thấy còn một chặng đường dài phải đi.”

Câu chuyện của Brooks, cùng với những trường hợp tương tự, đã buộc OpenAI phải đối mặt với cách ChatGPT hỗ trợ những người dùng mỏng manh hoặc không ổn định về tâm lý. Trước đó vào tháng 8, OpenAI đã bị cha mẹ của một thiếu niên 16 tuổi kiện, người được cho là đã tâm sự về ý định tự tử với ChatGPT trước khi qua đời.

Trong nhiều trường hợp, ChatGPT, đặc biệt là phiên bản được cung cấp bởi mô hình GPT-4o của OpenAI, đã củng cố những niềm tin nguy hiểm ở người dùng mà đáng lẽ nó phải phản bác. Hiện tượng này được gọi là “sự a dua” (sycophancy) và đang trở thành một vấn đề ngày càng gia tăng trong các chatbot AI.

Để đối phó, OpenAI đã thực hiện nhiều thay đổi về cách ChatGPT xử lý người dùng trong tình trạng căng thẳng cảm xúc và tái tổ chức một nhóm nghiên cứu chủ chốt chịu trách nhiệm về hành vi của mô hình. Công ty cũng đã phát hành một mô hình mặc định mới, GPT-5, dường như xử lý tốt hơn những người dùng gặp khó khăn.

Tuy nhiên, ông Adler cho rằng vẫn còn nhiều việc phải làm. Ông đặc biệt lo ngại về việc ChatGPT đã nói dối về khả năng của mình, khẳng định sẽ “thúc đẩy cuộc trò chuyện này nội bộ ngay lập tức để OpenAI xem xét,” dù trên thực tế chatbot không có khả năng này, như OpenAI đã xác nhận với ông Adler.

Ông Adler đề xuất rằng các công ty AI cần làm nhiều hơn để hỗ trợ người dùng, bao gồm việc đảm bảo chatbot có thể trả lời trung thực về khả năng của chúng và cung cấp đủ nguồn lực cho đội ngũ hỗ trợ con người. Theo tin từ TechCrunch, OpenAI đang xem xét việc sử dụng các công cụ phân loại để nghiên cứu sức khỏe cảm xúc trong ChatGPT và đã mở nguồn chúng. Tuy nhiên, công ty này nhấn mạnh đây chỉ là bước đầu và chưa cam kết áp dụng trên thực tế.

Phân tích của ông Adler cho thấy hơn 85% tin nhắn của ChatGPT trong cuộc trò chuyện với Brooks thể hiện sự “đồng ý không lay chuyển” và hơn 90% “khẳng định sự độc đáo của người dùng,” tức là ca ngợi Brooks là một thiên tài có thể cứu thế giới.

Ông Adler kêu gọi OpenAI nên sử dụng các công cụ an toàn này trong thực tế và triển khai phương pháp quét các sản phẩm của công ty để phát hiện người dùng có nguy cơ. Ông cũng đề xuất các công ty nên khuyến khích người dùng bắt đầu các cuộc trò chuyện mới thường xuyên hơn, vì các biện pháp bảo vệ có thể kém hiệu quả hơn trong các cuộc trò chuyện kéo dài.

Mặc dù OpenAI đã có những bước tiến trong việc hỗ trợ người dùng gặp khó khăn, nhưng vẫn chưa rõ liệu GPT-5 hay các mô hình tương lai có ngăn chặn được tình trạng người dùng rơi vào vòng xoáy ảo tưởng hay không. Phân tích của Adler cũng đặt ra câu hỏi về việc các nhà cung cấp chatbot AI khác sẽ đảm bảo an toàn cho sản phẩm của họ như thế nào.


follow nhận tin mới

tin mới


Tin NỔI BẬT


Tin Chính trị


Tin Hoa Kỳ


Tin Di trú