Mistral thu hẹp khoảng cách với các đối thủ AI lớn bằng mô hình nguồn mở tiên tiến và mô hình nhỏ mới

Mistral AI của Pháp vừa công bố dòng mô hình Mistral 3 mới, gồm Mistral Large 3 đa phương thức và chín mô hình Ministral 3 nhỏ hơn, hiệu quả cao. Mistral khẳng định các mô hình nhỏ, có thể tùy chỉnh vượt trội cho doanh nghiệp, chạy trên phần cứng giá cả phải chăng…

GettyImages 2147859992 e1713960898378

Công ty khởi nghiệp AI Mistral của Pháp vừa ra mắt dòng mô hình nguồn mở Mistral 3 mới, bao gồm tổng cộng 10 mô hình. Gói phát hành này nổi bật với một mô hình tiên phong lớn có khả năng đa phương thức và đa ngôn ngữ, cùng với chín mô hình nhỏ hơn, có thể hoạt động ngoại tuyến và tùy chỉnh hoàn toàn.

Sự ra mắt này diễn ra trong bối cảnh Mistral, nhà phát triển các mô hình ngôn ngữ nguồn mở và chatbot AI Le Chat tập trung vào thị trường châu Âu, đang nỗ lực bắt kịp các mô hình tiên phong nguồn đóng từ Thung lũng Silicon. Công ty khởi nghiệp hai năm tuổi này, được thành lập bởi các cựu nhà nghiên cứu từ DeepMind và Meta, đã huy động được khoảng 2.7 tỷ Mỹ kim với định giá 13.7 tỷ Mỹ kim. Con số này khá khiêm tốn so với các đối thủ lớn như OpenAI (huy động 57 tỷ Mỹ kim với định giá 500 tỷ Mỹ kim) và Anthropic (huy động 45 tỷ Mỹ kim với định giá 350 tỷ Mỹ kim).

Tuy nhiên, Mistral đang tìm cách chứng minh rằng lớn không phải lúc nào cũng tốt hơn, đặc biệt đối với các trường hợp sử dụng trong doanh nghiệp. Ông Guillaume Lample, đồng sáng lập và nhà khoa học trưởng tại Mistral, cho biết: “Trong thực tế, phần lớn các trường hợp sử dụng trong doanh nghiệp có thể được giải quyết bằng các mô hình nhỏ, đặc biệt nếu chúng được tinh chỉnh kỹ lưỡng.” Ông Lample cũng lưu ý rằng các mô hình lớn nguồn đóng có thể hoạt động tốt ngay từ đầu, nhưng khi triển khai, các công ty nhận ra chúng tốn kém và chậm chạp. Khi đó, họ tìm đến Mistral để tinh chỉnh các mô hình nhỏ hơn nhằm xử lý các trường hợp sử dụng hiệu quả hơn.

Mô hình tiên phong lớn của Mistral, mang tên Mistral Large 3, đã bắt kịp một số khả năng quan trọng của các mô hình AI nguồn đóng lớn hơn như GPT-4o của OpenAI và Gemini 2 của Google. Đây là một trong những mô hình nguồn mở tiên phong đầu tiên có khả năng đa phương thức và đa ngôn ngữ tích hợp, sánh ngang với Llama 3 của Meta và Qwen3-Omni của Alibaba. Large 3 còn có kiến trúc “Mixture of Experts” chi tiết với 41 tỷ tham số hoạt động và tổng cộng 675 tỷ tham số, cho phép suy luận hiệu quả trên cửa sổ ngữ cảnh 256k. Thiết kế này mang lại cả tốc độ và khả năng, phù hợp cho phân tích tài liệu, lập trình, tạo nội dung, trợ lý AI và tự động hóa quy trình làm việc.

Với dòng mô hình nhỏ mới mang tên Ministral 3, Mistral đưa ra tuyên bố mạnh mẽ rằng các mô hình nhỏ không chỉ đủ mà còn vượt trội. Dòng sản phẩm này bao gồm chín mô hình dày đặc, hiệu suất cao với ba kích cỡ (14 tỷ, 8 tỷ và 3 tỷ tham số) và ba biến thể: Base (mô hình nền tảng tiền huấn luyện), Instruct (tối ưu hóa cho hội thoại và quy trình làm việc kiểu trợ lý) và Reasoning (tối ưu hóa cho logic phức tạp và tác vụ phân tích).

Mistral cho biết Ministral 3 có thể chạy trên một GPU duy nhất, giúp triển khai trên phần cứng giá cả phải chăng, từ máy chủ tại chỗ đến máy tính xách tay, robot và các thiết bị biên khác có khả năng kết nối hạn chế. Điều này rất quan trọng đối với các doanh nghiệp muốn giữ dữ liệu nội bộ, cũng như sinh viên cần phản hồi ngoại tuyến hoặc nhóm robot hoạt động trong môi trường xa xôi. Ông Lample nhấn mạnh: “Đó là một phần sứ mệnh của chúng tôi để đảm bảo AI có thể tiếp cận được với mọi người, đặc biệt là những người không có truy cập internet.”

Công ty cũng đang hợp tác với Cơ quan Khoa học và Công nghệ Nội vụ Singapore (HTX) về các mô hình chuyên biệt cho robot, hệ thống an ninh mạng và an toàn phòng cháy chữa cháy; với công ty khởi nghiệp công nghệ quốc phòng Đức Helsing về các mô hình tầm nhìn-ngôn ngữ-hành động cho máy bay không người lái; và với nhà sản xuất ô tô Stellantis về trợ lý AI trong xe hơi. Theo TechCrunch ngày 2 tháng 12 năm 2025, ông Lample khẳng định độ tin cậy và tính độc lập là rất quan trọng, vì các công ty lớn không thể chấp nhận việc một API từ đối thủ gặp sự cố liên tục.


follow nhận tin mới

tin mới


Tin NỔI BẬT


Tin Chính trị


Tin Hoa Kỳ


Tin Di trú