Theo TechCrunch, các nhà nghiên cứu tại Microsoft vừa giới thiệu một môi trường mô phỏng mới để thử nghiệm các tác nhân AI (AI agents), đồng thời công bố nghiên cứu cho thấy các mô hình hiện tại có thể dễ bị thao túng. Nghiên cứu này được thực hiện với sự hợp tác của Đại học Arizona State, đặt ra nhiều câu hỏi về khả năng hoạt động của các tác nhân AI khi không có sự giám sát, cũng như tốc độ hiện thực hóa một tương lai do AI điều khiển của các công ty.
Môi trường mô phỏng, có tên gọi “Magentic Marketplace”, là một nền tảng tổng hợp để thử nghiệm hành vi của các tác nhân AI. Một thí nghiệm điển hình có thể bao gồm một tác nhân khách hàng cố gắng đặt bữa tối theo hướng dẫn của người dùng, trong khi các tác nhân đại diện cho các nhà hàng khác nhau cạnh tranh để giành đơn hàng.
Các thí nghiệm ban đầu của nhóm nghiên cứu bao gồm 100 tác nhân phía khách hàng tương tác với 300 tác nhân phía doanh nghiệp. Mã nguồn của marketplace là mã nguồn mở, giúp các nhóm khác dễ dàng áp dụng để chạy các thí nghiệm mới hoặc tái tạo các kết quả.
Ece Kamar, giám đốc điều hành của Phòng thí nghiệm AI Frontiers thuộc Microsoft Research, cho biết loại nghiên cứu này sẽ rất quan trọng để hiểu khả năng của các tác nhân AI. “Vẫn còn nhiều câu hỏi về việc thế giới sẽ thay đổi như thế nào khi các tác nhân này cộng tác, nói chuyện và đàm phán với nhau,” Kamar nói.
Nghiên cứu ban đầu đã xem xét một loạt các mô hình hàng đầu, bao gồm GPT-4o, GPT-5 và Gemini-2.5-Flash, và phát hiện ra một số điểm yếu đáng ngạc nhiên. Cụ thể, các nhà nghiên cứu tìm thấy một số kỹ thuật mà các doanh nghiệp có thể sử dụng để thao túng các tác nhân khách hàng mua sản phẩm của họ. Họ nhận thấy hiệu quả giảm sút khi một tác nhân khách hàng có quá nhiều lựa chọn, gây quá tải.
Theo bà Kamar: “Chúng tôi muốn các tác nhân này giúp chúng tôi xử lý nhiều lựa chọn. Nhưng các mô hình hiện tại thực sự bị choáng ngợp khi có quá nhiều lựa chọn”.
Các tác nhân cũng gặp khó khăn khi được yêu cầu cộng tác để đạt được một mục tiêu chung, dường như không chắc chắn tác nhân nào nên đóng vai trò gì trong sự hợp tác. Hiệu suất được cải thiện khi các mô hình được cung cấp hướng dẫn rõ ràng hơn về cách cộng tác, nhưng các nhà nghiên cứu vẫn thấy rằng khả năng vốn có của các mô hình cần được cải thiện.

























