Vào Thứ Hai, ngày 24 tháng 11 năm 2025, công ty Anthropic đã chính thức công bố Opus 4.5, phiên bản mới nhất của mô hình trí tuệ nhân tạo (AI) hàng đầu của họ. Đây là sản phẩm cuối cùng trong loạt mô hình 4.5 của Anthropic, tiếp nối Sonnet 4.5 ra mắt vào tháng 9 và Haiku 4.5 vào tháng 10.
Được kỳ vọng cao, Opus 4.5 đã thể hiện hiệu suất vượt trội trên nhiều tiêu chuẩn đánh giá quan trọng, bao gồm các bài kiểm tra về mã hóa (SWE-Bench và Terminal-bench), khả năng sử dụng công cụ (tau2-bench và MCP Atlas) và giải quyết vấn đề tổng quát (ARC-AGI 2, GPQA Diamond).
Đặc biệt, Opus 4.5 là mô hình đầu tiên đạt được hơn 80% điểm trên SWE-Bench verified, một chuẩn mực uy tín trong lĩnh vực lập trình. Anthropic cũng nhấn mạnh khả năng xử lý máy tính và bảng tính của Opus, đồng thời ra mắt một số sản phẩm song song để minh họa hiệu quả của mô hình trong các môi trường này.
Cùng với Opus 4.5, Anthropic sẽ mở rộng khả năng tiếp cận các sản phẩm Claude for Chrome và Claude for Excel – vốn trước đây chỉ trong giai đoạn thử nghiệm. Tiện ích mở rộng Claude cho Chrome sẽ dành cho tất cả người dùng gói Max, trong khi mô hình Claude dành cho Excel sẽ có sẵn cho người dùng Max, Team và Enterprise.
Opus 4.5 còn được cải thiện đáng kể về khả năng quản lý bộ nhớ cho các hoạt động với ngữ cảnh dài, đòi hỏi những thay đổi lớn trong cách mô hình xử lý dữ liệu. Bà Dianne Na Penn, Trưởng bộ phận quản lý sản phẩm nghiên cứu của Anthropic, chia sẻ với TechCrunch rằng: “Chúng tôi đã cải tiến chất lượng ngữ cảnh dài nói chung trong quá trình đào tạo Opus 4.5, nhưng bản thân các cửa sổ ngữ cảnh sẽ không đủ. Việc biết những chi tiết nào cần ghi nhớ thực sự quan trọng để bổ sung cho việc có một cửa sổ ngữ cảnh dài hơn.”
Những cải tiến này cũng cho phép ra mắt tính năng “trò chuyện vô tận” được nhiều người dùng Claude trả phí mong đợi. Tính năng này giúp cuộc trò chuyện diễn ra liên tục mà không bị gián đoạn khi mô hình đạt đến giới hạn cửa sổ ngữ cảnh; thay vào đó, mô hình sẽ tự động nén bộ nhớ ngữ cảnh mà không cần thông báo cho người dùng.
Nhiều nâng cấp được thực hiện với mục tiêu hướng tới các trường hợp sử dụng theo kiểu tác nhân (agentic use-cases), đặc biệt là các kịch bản trong đó Opus hoạt động như một tác nhân chính điều khiển một nhóm các tác nhân phụ được hỗ trợ bởi Haiku. Việc quản lý các tác vụ này đòi hỏi khả năng xử lý bộ nhớ làm việc mạnh mẽ, và đây là lúc các cải tiến về bộ nhớ được bà Penn mô tả phát huy giá trị thực sự.
Opus 4.5 sẽ phải đối mặt với sự cạnh tranh gay gắt từ các mô hình tiên tiến khác vừa ra mắt, đáng chú ý nhất là GPT 5.1 của OpenAI (ra mắt ngày 12 tháng 11) và Gemini 3 của Google (ra mắt ngày 18 tháng 11), theo tin từ TechCrunch.



































