Microsoft Tạo Chợ Ảo Thử Nghiệm AI, Kết Quả Thất Bại Bất Ngờ

Microsoft đã xây dựng một thị trường ảo để thử nghiệm các tác nhân AI, cho thấy những hạn chế bất ngờ của chúng. Nghiên cứu chỉ ra rằng các tác nhân AI dễ bị thao túng và gặp khó khăn khi có quá nhiều lựa chọn hoặc khi phải cộng tác để đạt mục…

photo mosh getty windows logo

Theo TechCrunch, các nhà nghiên cứu tại Microsoft vừa giới thiệu một môi trường mô phỏng mới để thử nghiệm các tác nhân AI (AI agents), đồng thời công bố nghiên cứu cho thấy các mô hình hiện tại có thể dễ bị thao túng. Nghiên cứu này được thực hiện với sự hợp tác của Đại học Arizona State, đặt ra nhiều câu hỏi về khả năng hoạt động của các tác nhân AI khi không có sự giám sát, cũng như tốc độ hiện thực hóa một tương lai do AI điều khiển của các công ty.

Môi trường mô phỏng, có tên gọi “Magentic Marketplace”, là một nền tảng tổng hợp để thử nghiệm hành vi của các tác nhân AI. Một thí nghiệm điển hình có thể bao gồm một tác nhân khách hàng cố gắng đặt bữa tối theo hướng dẫn của người dùng, trong khi các tác nhân đại diện cho các nhà hàng khác nhau cạnh tranh để giành đơn hàng.

Các thí nghiệm ban đầu của nhóm nghiên cứu bao gồm 100 tác nhân phía khách hàng tương tác với 300 tác nhân phía doanh nghiệp. Mã nguồn của marketplace là mã nguồn mở, giúp các nhóm khác dễ dàng áp dụng để chạy các thí nghiệm mới hoặc tái tạo các kết quả.

Ece Kamar, giám đốc điều hành của Phòng thí nghiệm AI Frontiers thuộc Microsoft Research, cho biết loại nghiên cứu này sẽ rất quan trọng để hiểu khả năng của các tác nhân AI. “Vẫn còn nhiều câu hỏi về việc thế giới sẽ thay đổi như thế nào khi các tác nhân này cộng tác, nói chuyện và đàm phán với nhau,” Kamar nói.

Nghiên cứu ban đầu đã xem xét một loạt các mô hình hàng đầu, bao gồm GPT-4o, GPT-5 và Gemini-2.5-Flash, và phát hiện ra một số điểm yếu đáng ngạc nhiên. Cụ thể, các nhà nghiên cứu tìm thấy một số kỹ thuật mà các doanh nghiệp có thể sử dụng để thao túng các tác nhân khách hàng mua sản phẩm của họ. Họ nhận thấy hiệu quả giảm sút khi một tác nhân khách hàng có quá nhiều lựa chọn, gây quá tải.

Theo bà Kamar: “Chúng tôi muốn các tác nhân này giúp chúng tôi xử lý nhiều lựa chọn. Nhưng các mô hình hiện tại thực sự bị choáng ngợp khi có quá nhiều lựa chọn”.

Các tác nhân cũng gặp khó khăn khi được yêu cầu cộng tác để đạt được một mục tiêu chung, dường như không chắc chắn tác nhân nào nên đóng vai trò gì trong sự hợp tác. Hiệu suất được cải thiện khi các mô hình được cung cấp hướng dẫn rõ ràng hơn về cách cộng tác, nhưng các nhà nghiên cứu vẫn thấy rằng khả năng vốn có của các mô hình cần được cải thiện.


follow nhận tin mới

tin mới

  • Cháy lớn tại nhà thờ ở Hạt Northampton, Pennsylvania

    Cháy lớn tại nhà thờ ở Hạt Northampton, Pennsylvania

    Vụ hỏa hoạn nghiêm trọng đã xảy ra tại nhà thờ Gethsemane Ministries ở Hạt Northampton, Pennsylvania, gây thiệt hại nặng nề, với phần sau tòa nhà bị sụp đổ. Nguyên nhân đang được điều tra và không có ai bị thương.

  • Microsoft Tạo Chợ Ảo Thử Nghiệm AI, Kết Quả Thất Bại Bất Ngờ

    Microsoft Tạo Chợ Ảo Thử Nghiệm AI, Kết Quả Thất Bại Bất Ngờ

    Microsoft đã xây dựng một thị trường ảo để thử nghiệm các tác nhân AI, cho thấy những hạn chế bất ngờ của chúng. Nghiên cứu chỉ ra rằng các tác nhân AI dễ bị thao túng và gặp khó khăn khi có quá nhiều lựa chọn hoặc khi phải cộng tác để đạt mục…

  • Google giúp truy cập AI Mode trên Chrome dễ hơn

    Google giúp truy cập AI Mode trên Chrome dễ hơn

    Google vừa thông báo việc đơn giản hóa truy cập AI Mode trên di động thông qua một nút tắt chuyên dụng mới dưới thanh tìm kiếm khi mở trang “New Tab” trong Chrome. Shortcut mới sẽ sớm có mặt tại 160 quốc gia khác, theo TechCrunch.

  • Meta lao dốc vì chi tiêu cho AI, gợi nhớ năm 2022

    Meta lao dốc vì chi tiêu cho AI, gợi nhớ năm 2022

    Cổ phiếu Meta lao dốc do lo ngại về chi tiêu cho AI, gợi nhớ khoản đầu tư vào metaverse năm 2022. Các nhà phân tích lo ngại về việc thiếu lợi nhuận rõ ràng và sự đa dạng hóa trong mô hình kinh doanh của Meta. Tuy nhiên, một số người vẫn coi đây…

  • Tranh chấp gia đình ở San Jose thu lợi lớn từ bán bất động sản

    Tranh chấp gia đình ở San Jose thu lợi lớn từ bán bất động sản

    Gia đình tranh chấp quyền sở hữu tiệm sửa xe ở San Jose đã bán khu đất với giá 14.5 triệu đôla. Công ty địa ốc Spieker Investments có trụ sở tại Menlo Park là bên mua. Vụ việc phơi bày những tranh chấp nội bộ và rắc rối pháp lý kéo dài trong gia…

  • Spirit Christmas mở 30 cửa hàng mùa lễ hội

    Spirit Christmas mở 30 cửa hàng mùa lễ hội

    Chuỗi Spirit Halloween sẽ mở 30 cửa hàng Spirit Christmas tại 12 tiểu bang, bao gồm New Jersey và Pennsylvania. Khách hàng có thể mua sắm đồ trang trí, quà tặng và chụp ảnh với ông già Noel. Các cửa hàng dự kiến mở cửa đến hết năm.

  • Dublin: Xe tải lật trên I-680, gây đóng đường

    Dublin: Xe tải lật trên I-680, gây đóng đường

    Một xe tải lớn bị lật trên đường I-680 ở East Bay vào sáng Thứ Năm, làm gián đoạn giao thông. Vụ việc xảy ra lúc 5:45 sáng tại đoạn chuyển sang I-580 hướng đông. Lực lượng CHP đã đóng đoạn đường và khuyến cáo người dân chuẩn bị cho việc trì hoãn. Tài xế…

  • Michael Burry trở lại với hai vụ cược lớn

    Michael Burry trở lại với hai vụ cược lớn

    Michael Burry, nhà đầu tư nổi tiếng từ “The Big Short”, đang đặt cược chống lại Nvidia và Palantir, cho rằng AI là bong bóng. Quỹ Scion của ông đã mua lượng lớn quyền chọn bán (puts) cho thấy dự đoán giá cổ phiếu của hai công ty này sẽ giảm. CEO Palantir gọi những…

  • Người Mỹ dự chi gần $900 cho mùa lễ năm nay

    Người Mỹ dự chi gần $900 cho mùa lễ năm nay

    Theo Liên đoàn Bán lẻ Quốc gia, người Mỹ dự chi trung bình $890/người cho mua sắm mùa lễ. Các nhà bán lẻ như Target, Wayfair tung ra các chương trình giảm giá sớm để thu hút khách hàng. Bank of America nhận thấy người tiêu dùng ưu tiên các cửa hàng giảm giá và…

  • Khảo sát mới: Chi phí năng lượng tăng cao tại Texas, ảnh hưởng nặng nề đến dân nghèo và thiểu số

    Khảo sát mới: Chi phí năng lượng tăng cao tại Texas, ảnh hưởng nặng nề đến dân nghèo và thiểu số

    Khảo sát của Đại học Houston và Đại học Nam Texas cho thấy chi phí năng lượng tăng cao tại Texas, với gần 45% người dân trả hơn 200 đô la/tháng tiền điện mùa hè. 19% phải chọn giữa điện và nhu yếu phẩm. Gánh nặng này nặng nề hơn đối với các hộ thu…


Tin NỔI BẬT


Tin Chính trị


Tin Hoa Kỳ


Tin Di trú