Mistral AI, một công ty phát triển tại Pháp, vừa giới thiệu hai mẫu AI phiên âm mới là Voxtral Mini Transcribe 2 và Voxtral Realtime. Điểm nổi bật của các mẫu này là khả năng chạy trực tiếp trên thiết bị của người dùng (như điện thoại hoặc máy tính xách tay), thay vì gửi dữ liệu lên đám mây. Điều này không chỉ giúp tăng tốc độ xử lý mà còn đảm bảo quyền riêng tư cho các cuộc hội thoại nhạy cảm, như với bác sĩ hay luật sư, hoặc các cuộc phỏng vấn báo chí quan trọng.
Ông Pierre Stock, phó chủ tịch phụ trách hoạt động khoa học của Mistral, cho biết Voxtral Mini Transcribe 2 là một mẫu “siêu, siêu nhỏ”, trong khi Voxtral Realtime có thể thực hiện phiên âm trực tiếp với độ trễ dưới 200 mili giây, tương đương với khả năng đọc phụ đề trực tiếp. Cả hai mẫu đều là mã nguồn mở và có thể hoạt động nhanh hơn do dữ liệu không cần truyền qua internet để đến trung tâm dữ liệu và quay trở lại.
Mặc dù có những cải tiến đáng kể về tốc độ và quyền riêng tư, các mẫu này đôi khi vẫn gặp khó khăn với việc nhận diện tên riêng, ví dụ như nhầm lẫn “Mistral AI” thành “Mr. Lay Eye”. Tuy nhiên, Mistral AI cho biết người dùng có thể tùy chỉnh mô hình để nhận diện tốt hơn các từ, tên riêng và thuật ngữ chuyên ngành.
Cả hai mẫu Voxtral đều có sẵn thông qua API của Mistral và trên nền tảng Hugging Face, nơi người dùng có thể dùng thử. Theo tin từ CNET ngày 4 tháng 2 năm 2026, việc Mistral AI phát triển các mô hình AI nhỏ gọn, nhanh chóng và bảo mật cho thấy xu hướng ngày càng tăng trong việc đưa trí tuệ nhân tạo đến gần hơn với người dùng cuối.


































