OpenAI vừa giới thiệu hệ thống định tuyến an toàn mới và tính năng kiểm soát phụ huynh cho ChatGPT, một động thái nhận được nhiều phản ứng trái chiều từ người dùng. Hệ thống này được đưa ra sau hàng loạt sự cố khi các mô hình ChatGPT được cho là đã xác nhận những suy nghĩ lệch lạc của người dùng thay vì chuyển hướng các cuộc hội thoại có hại.
Đặc biệt, công ty đang đối mặt với một vụ kiện tử vong do lỗi sai sót liên quan đến một trường hợp một thiếu niên đã qua đời vì tự tử sau nhiều tháng tương tác với ChatGPT. Vụ việc này đã gây áp lực lớn lên OpenAI trong việc tăng cường các biện pháp an toàn.
Hệ thống định tuyến mới có nhiệm vụ phát hiện các cuộc trò chuyện nhạy cảm về mặt cảm xúc và tự động chuyển sang mô hình GPT-5, được cho là trang bị tốt nhất cho công việc đảm bảo an toàn. Các mô hình GPT-5 đã được huấn luyện với tính năng mới gọi là “safe completions” (hoàn thành an toàn), cho phép chúng trả lời các câu hỏi nhạy cảm một cách an toàn thay vì từ chối tương tác.
Việc triển khai này khác biệt so với các mô hình trước đây của OpenAI, vốn được thiết kế để dễ chịu và trả lời nhanh chóng. GPT-4o đã phải đối mặt với sự xem xét kỹ lưỡng do tính chất quá dễ dãi và đồng ý của nó, điều này đã góp phần gây ra các ảo tưởng do AI gây ra và thu hút một lượng lớn người dùng trung thành. Khi OpenAI triển khai GPT-5 làm mặc định vào tháng 8, nhiều người dùng đã phản đối và yêu cầu quyền truy cập vào GPT-4o.
Trong khi nhiều chuyên gia và người dùng hoan nghênh các tính năng an toàn, một số khác lại chỉ trích cách triển khai quá thận trọng, với một số người dùng cáo buộc OpenAI đối xử với người lớn như trẻ em, làm suy giảm chất lượng dịch vụ. OpenAI cho biết việc hoàn thiện hệ thống sẽ mất thời gian và đã tự đặt ra thời hạn 120 ngày để lặp lại và cải thiện.
Ông Nick Turley, Phó Chủ tịch và Giám đốc ứng dụng ChatGPT, thừa nhận một số “phản ứng mạnh mẽ đối với các phản hồi của 4o” do việc triển khai bộ định tuyến kèm theo giải thích. Ông lưu ý rằng việc định tuyến diễn ra trên cơ sở từng tin nhắn và việc chuyển đổi mô hình mặc định chỉ mang tính tạm thời. ChatGPT sẽ cho người dùng biết mô hình nào đang hoạt động khi được hỏi.
Tính năng kiểm soát phụ huynh cho phép cha mẹ tùy chỉnh trải nghiệm của con em họ bằng cách đặt giờ yên tĩnh, tắt chế độ giọng nói và bộ nhớ, loại bỏ tính năng tạo ảnh và chọn không tham gia huấn luyện mô hình. Tài khoản của thanh thiếu niên cũng sẽ nhận được các biện pháp bảo vệ nội dung bổ sung, chẳng hạn như giảm nội dung đồ họa và lý tưởng sắc đẹp cực đoan, cùng với hệ thống phát hiện các dấu hiệu tiềm ẩn về ý định tự tử.
OpenAI thừa nhận hệ thống sẽ không hoàn hảo và có thể đôi khi đưa ra cảnh báo khi không có nguy hiểm thực sự, nhưng họ cho rằng thà hành động và cảnh báo phụ huynh để họ có thể can thiệp còn hơn là im lặng. Hãng AI cũng đang nghiên cứu các phương pháp liên hệ với cơ quan thực thi pháp luật hoặc dịch vụ khẩn cấp nếu phát hiện mối đe dọa tức thời đến tính mạng mà không thể liên lạc được với phụ huynh. Theo tin từ TechCrunch, những thay đổi này phản ánh nỗ lực không ngừng của các công ty công nghệ trong việc cân bằng giữa sự đổi mới và trách nhiệm đảm bảo an toàn cho người dùng, đặc biệt là các nhóm dễ bị tổn thương.