Speechify, một ứng dụng trước đây chủ yếu dùng để đọc các bài viết, tài liệu PDF và văn bản, vừa công bố những cải tiến mới cho tiện ích Chrome của mình. Ứng dụng giờ đây tích hợp khả năng nhập liệu bằng giọng nói (voice typing) và một trợ lý giọng nói thông minh có thể trả lời các câu hỏi của người dùng.
Sự phát triển của công nghệ nhận dạng giọng nói trong 12 tháng qua đã tạo điều kiện cho sự ra đời của nhiều công cụ tương tự. Speechify cũng đang tận dụng xu hướng này, giới thiệu tính năng đọc chính tả hỗ trợ tiếng Anh. Giống như các công cụ khác, tính năng này hứa hẹn sửa lỗi và loại bỏ các từ ngữ thừa.
Trong quá trình thử nghiệm, người dùng ghi nhận một số hạn chế, như việc tính năng hoạt động chưa ổn định trên các trang như WordPress, dù đã hoạt động tốt với Gmail và Google Docs. Đại diện Speechify cho biết họ đang dần tối ưu hóa cho các trang web phổ biến.
Về độ chính xác, tỷ lệ lỗi nhận dạng từ của Speechify được cho là cao hơn một số công cụ khác. Tuy nhiên, công ty cho biết mô hình của họ sẽ học hỏi và cải thiện theo thời gian sử dụng.
Điểm nhấn mới là trợ lý giọng nói đàm thoại, nằm ở thanh bên của trình duyệt. Người dùng có thể đặt câu hỏi về nội dung trang web, yêu cầu tóm tắt hoặc giải thích đơn giản. Mặc dù các nền tảng như ChatGPT và Gemini cũng có chế độ đàm thoại, Speechify nhấn mạnh sự khác biệt khi giọng nói là yếu tố cốt lõi, là trải nghiệm mặc định của ứng dụng.
“Chúng tôi tin rằng giọng nói sẽ luôn là tùy chọn ưu tiên, là cài đặt mặc định mỗi khi người dùng mở ứng dụng và tương tác với AI, dựa trên kinh nghiệm nhiều năm xây dựng Speechify,” ông Rohan Pavuluri, Giám đốc Kinh doanh của công ty, chia sẻ.
Một điểm cần lưu ý là trợ lý của Speechify hiện chưa hỗ trợ các trình duyệt có sẵn trợ lý ở thanh bên như OpenAI Atlas hay Perplexity Comet. Tuy nhiên, công ty tập trung chủ yếu vào Chrome với lượng người dùng lớn.
Speechify dự kiến sẽ dần tích hợp cả tính năng nhập liệu bằng giọng nói và trợ lý giọng nói vào tất cả các ứng dụng của mình trên cả máy tính và thiết bị di động. Họ cũng có kế hoạch phát triển các tác nhân AI có thể thực hiện tác vụ thay người dùng, như đặt lịch hẹn hoặc chờ hỗ trợ khách hàng.
Thông tin này được cung cấp bởi TechCrunch.
































