Tập đoàn công nghệ Google vừa công bố ra mắt Gemini 3, một bước tiến quan trọng nhằm “hiện thực hóa mọi ý tưởng”. Mô hình đầu tiên trong dòng này là Gemini 3 Pro, đang được triển khai trên ứng dụng Gemini và chế độ AI Mode ngay từ hôm nay.
Kể từ Gemini 1.0 tập trung vào tính đa phương thức và cửa sổ ngữ cảnh dài, đến Gemini 2.0 với khả năng lý luận nâng cao, và Gemini 2.5 với năng lực lý luận sâu và lập trình, Gemini 3 (bỏ đi hậu tố “.0”) được Google mô tả là “mô hình thông minh nhất” của họ, giúp người dùng “hiện thực hóa mọi ý tưởng.”
Gemini 3 nổi bật với khả năng cải thiện đáng kể trong việc nắm bắt ngữ cảnh và ý định yêu cầu của người dùng, giúp người dùng đạt được điều mình cần với ít lời nhắc hơn. Mô hình này dẫn đầu trong khả năng lý luận, có thể “nắm bắt chiều sâu và sự tinh tế” của các ý tưởng sáng tạo hoặc phân tích các lớp phức tạp của một vấn đề khó khăn.
Các phản hồi từ Gemini 3 Pro được thiết kế để “thông minh, súc tích và trực tiếp”, mang lại những hiểu biết sâu sắc thực sự thay vì những câu văn sáo rỗng. Mô hình này hoạt động như một đối tác tư duy đáng tin cậy, cung cấp những cách mới để hiểu thông tin và thể hiện bản thân, từ việc dịch các khái niệm khoa học phức tạp bằng cách tạo mã cho hình ảnh hóa độ chân thực cao đến việc hỗ trợ động não sáng tạo.
Trong các thử nghiệm, Gemini 3 Pro đạt điểm cao ấn tượng trên nhiều tiêu chuẩn, bao gồm LMArena (1501 điểm), Humanity’s Last Exam (37.5% không dùng công cụ), GPQA Diamond (91.9%) và MathArena Apex (23.4%), thể hiện khả năng giải quyết các vấn đề phức tạp trong nhiều lĩnh vực khoa học và toán học với độ tin cậy cao. Ngoài văn bản, Gemini 3 Pro cũng thiết lập tiêu chuẩn mới về lý luận đa phương thức với điểm số đột phá trên MMMU-Pro (81%) và Video-MMMU (87.6%).
Google cũng công bố chế độ Gemini 3 Deep Think, với khả năng lý luận và hiểu đa phương thức tốt hơn nữa, sẽ sớm có mặt cho người đăng ký AI Ultra. Chế độ này vượt trội hơn Gemini 3 Pro trên Humanity’s Last Exam (41.0% không dùng công cụ) và GPQA Diamond (93.8%).
Một tính năng đột phá của Gemini 3 là Generative UI (giao diện người dùng tự sinh), cho phép các mô hình ngôn ngữ lớn (LLM) tạo ra cả nội dung và toàn bộ trải nghiệm người dùng, bao gồm các trang web, trò chơi, công cụ và ứng dụng được “thiết kế tự động và tùy chỉnh hoàn toàn” dựa trên yêu cầu của người dùng. Đây được coi là bước đầu tiên hướng tới các trải nghiệm người dùng do AI hoàn toàn tự tạo.
Thêm vào đó, Google đã giới thiệu Google Antigravity, một nền tảng phát triển tác nhân mới, cho phép các nhà phát triển “hoạt động ở cấp độ cao hơn, theo định hướng nhiệm vụ”. Nền tảng này sử dụng Gemini 3 và Gemini 2.5 Computer Use, giúp các tác nhân tự động lập kế hoạch và thực hiện các tác vụ phần mềm phức tạp từ đầu đến cuối, đồng thời tự kiểm tra mã của chúng. Antigravity hiện đã có sẵn trên Mac, Windows và Linux, theo 9to5Google.

































