Tôi đã tạo những lâu đài kẹo dẻo trong công cụ tạo thế giới AI mới của Google

Google DeepMind ra mắt Project Genie, công cụ AI tạo thế giới game tương tác từ văn bản hoặc ảnh, cho người dùng gói Google AI Ultra tại Mỹ trải nghiệm. Công cụ này kết hợp Genie 3, Nano Banana Pro và Gemini, cho phép tạo các thế giới nghệ thuật nhưng còn hạn chế…

Project Genie

Google DeepMind vừa mở cửa cho Project Genie, một công cụ trí tuệ nhân tạo (AI) cho phép người dùng tạo ra các thế giới trò chơi tương tác chỉ bằng những câu lệnh văn bản hoặc hình ảnh.

Từ ngày thứ Năm, những người đăng ký gói Google AI Ultra tại Hoa Kỳ có thể trải nghiệm thử nghiệm prototype nghiên cứu này. Project Genie được vận hành bởi sự kết hợp giữa mô hình thế giới mới nhất của Google, Genie 3, cùng với mô hình tạo ảnh Nano Banana Pro và Gemini.

Việc ra mắt này, diễn ra năm tháng sau bản xem trước nghiên cứu của Genie 3, là một phần trong nỗ lực rộng lớn hơn nhằm thu thập phản hồi và dữ liệu đào tạo khi DeepMind chạy đua phát triển các mô hình thế giới ngày càng mạnh mẽ hơn. Các mô hình thế giới được coi là bước đi quan trọng để đạt được trí tuệ nhân tạo tổng quát (AGI).

Trong bối cảnh cuộc đua phát triển mô hình thế giới đang nóng lên, với các đối thủ như World Labs của Fei-Fei Li, Runway và AMI Labs của Yann LeCun, Google DeepMind mong muốn nhận được ý kiến đóng góp từ cộng đồng người dùng để cải thiện công cụ.

Theo TechCrunch, công cụ này có thể tạo ra các thế giới dựa trên yêu cầu nghệ thuật như phong cách vẽ màu nước, anime hoặc hoạt hình cổ điển. Tuy nhiên, nó gặp khó khăn với các thế giới đòi hỏi tính chân thực cao hoặc phong cách điện ảnh, đôi khi trông giống game hơn là đời thực.

Khi sử dụng ảnh thật để làm cơ sở, Project Genie cũng cho kết quả không đồng đều. Dù có thể tạo ra các vật thể chuyển động và tương tác trong môi trường, nhưng đôi khi nhân vật lại đi xuyên qua tường hoặc các vật thể rắn khác. Giao diện điều khiển bằng các phím mũi tên, phím cách và WASD cũng có thể gây khó khăn cho người không chuyên về game.

Hiện tại, mỗi phiên sử dụng công cụ này bị giới hạn 60 giây tạo và khám phá thế giới do các ràng buộc về ngân sách và năng lực xử lý. Google DeepMind cam kết sẽ tiếp tục cải thiện tính chân thực và khả năng tương tác của Project Genie trong tương lai, nhằm mang đến những trải nghiệm độc đáo và mới lạ cho người dùng, theo tin từ TechCrunch.


follow nhận tin mới

tin mới