Động Cơ Suy Luận Mới Của Clarifai Giúp Mô Hình AI Nhanh Hơn, Rẻ Hơn

Clarifai ra mắt động cơ suy luận mới, giúp các mô hình trí tuệ nhân tạo (AI) chạy nhanh gấp đôi và tiết kiệm chi phí tới 40%. Hệ thống này tối ưu hóa sâu rộng, đặc biệt cho các mô hình AI agentic đa bước, giải quyết áp lực lớn về hạ tầng AI…

GettyImages 1862779720

Ngày Thứ Năm vừa qua, công ty Clarifai, một nền tảng chuyên về trí tuệ nhân tạo (AI), đã công bố một động cơ suy luận (reasoning engine) mới mà họ tuyên bố sẽ giúp vận hành các mô hình AI nhanh gấp đôi và giảm chi phí tới 40%. Hệ thống này được thiết kế để linh hoạt thích ứng với nhiều loại mô hình và nền tảng điện toán đám mây khác nhau, sử dụng một loạt các tối ưu hóa để tăng cường sức mạnh suy luận từ cùng một phần cứng.

Ông Matthew Zeiler, Giám đốc Điều hành của Clarifai, cho biết đây là sự kết hợp của nhiều loại tối ưu hóa khác nhau, từ các nhân CUDA cho đến các kỹ thuật giải mã tiên đoán cao cấp, giúp tận dụng tối đa khả năng của các card đồ họa hiện có.

Kết quả đã được xác minh qua một loạt các bài kiểm tra đánh giá bởi công ty độc lập Artificial Analysis, ghi nhận các kỷ lục hàng đầu trong ngành về cả thông lượng và độ trễ. Quá trình này đặc biệt tập trung vào suy luận (inference) – nhu cầu tính toán để vận hành một mô hình AI đã được đào tạo. Gánh nặng tính toán này ngày càng tăng mạnh với sự xuất hiện của các mô hình AI agentic và suy luận, vốn đòi hỏi nhiều bước xử lý cho một lệnh duy nhất.

Khởi đầu là một dịch vụ thị giác máy tính, Clarifai ngày càng chú trọng vào việc điều phối tính toán (compute orchestration) khi sự bùng nổ của AI đã làm tăng đáng kể nhu cầu về cả Bộ xử lý đồ họa (GPU) và các trung tâm dữ liệu chứa chúng. Công ty này lần đầu tiên giới thiệu nền tảng tính toán của mình tại sự kiện AWS re:Invent vào tháng 12. Tuy nhiên, động cơ suy luận mới này là sản phẩm đầu tiên được thiết kế riêng cho các mô hình agentic đa bước.

Sản phẩm ra đời trong bối cảnh áp lực gay gắt lên cơ sở hạ tầng AI, dẫn đến một loạt các thỏa thuận trị giá hàng tỷ Mỹ kim. OpenAI đã vạch ra kế hoạch chi tới 1 nghìn tỷ Mỹ kim cho việc xây dựng các trung tâm dữ liệu mới, dự đoán nhu cầu tính toán trong tương lai là gần như vô hạn. Nhưng trong khi việc xây dựng phần cứng đang diễn ra mạnh mẽ, Giám đốc Điều hành Clarifai tin rằng vẫn còn nhiều điều cần làm để tối ưu hóa cơ sở hạ tầng hiện có.

Ông Zeiler nhận định, “Có những ‘thủ thuật’ phần mềm giúp các mô hình tốt như thế này tiến xa hơn, như động cơ suy luận của Clarifai, nhưng cũng có những cải tiến thuật toán có thể giúp chống lại nhu cầu về các trung tâm dữ liệu với công suất hàng gigawatt. Và tôi không nghĩ chúng ta đã đi đến cuối của những đổi mới thuật toán này”, theo tin từ TechCrunch ngày 25/09/2025.


follow nhận tin mới

tin mới


Tin NỔI BẬT


Tin Chính trị


Tin Hoa Kỳ


Tin Di trú