Subtle Computing: Các Mô Hình Cách Ly Giọng Nói Giúp Máy Tính Hiểu Rõ Hơn Trong Môi Trường Ồn Ào

Subtle Computing, một công ty khởi nghiệp tại California, đã huy động $6 triệu để phát triển các mô hình cách ly giọng nói. Công nghệ này giúp máy tính hiểu rõ người dùng hơn trong môi trường ồn ào, giải quyết thách thức lớn cho các ứng dụng AI giọng nói. Với các mô…

Press Release Photo Close 1

Subtle Computing, một công ty khởi nghiệp có trụ sở tại California, đang giải quyết thách thức lớn trong lĩnh vực công nghệ giọng nói bằng các mô hình cách ly giọng nói tiên tiến của mình. Công nghệ này được thiết kế để giúp máy tính có thể hiểu rõ người dùng ngay cả trong những môi trường ồn ào nhất, mang lại lợi ích đáng kể cho các sản phẩm và dịch vụ AI dựa trên giọng nói.

Hiện nay, các ứng dụng AI giọng nói như phần mềm ghi chú cuộc họp (Granola, Fireflies, Fathom, Read AI), các giải pháp tích hợp của OpenAI, ClickUp, Notion, hay các thiết bị phần cứng như Plaud và Sandbar đang phát triển mạnh mẽ. Tuy nhiên, một trong những trở ngại lớn nhất của chúng là khả năng thu âm giọng nói người dùng một cách chính xác trong môi trường có nhiều tiếng ồn, ví dụ như quán cà phê đông đúc hay văn phòng chia sẻ.

Để khắc phục điều này, Subtle Computing đã phát triển một mô hình cách ly giọng nói toàn diện, có khả năng lọc bỏ tạp âm và tập trung vào giọng nói của người dùng. Thay vì gửi dữ liệu giọng nói lên đám mây để xử lý, cách làm thường tốn kém và không hiệu quả, công ty tập trung vào việc huấn luyện các mô hình chuyên biệt, phù hợp với đặc tính âm thanh của từng thiết bị cụ thể và thích ứng với giọng nói của người dùng. Phương pháp này giúp cải thiện hiệu suất đáng kể so với các giải pháp chung.

Được thành lập bởi Tyler Chen, David Harrison, Savannah Cofer và Jackie Yang, những cựu sinh viên Stanford, Subtle Computing nhấn mạnh tầm quan trọng của việc thiết bị hiểu người dùng trong mọi hoàn cảnh khi tương tác với AI. Các mô hình của họ có thể chạy trực tiếp trên thiết bị với kích thước chỉ vài megabyte và độ trễ 100ms, đảm bảo khả năng chuyển đổi giọng nói thành văn bản chính xác hơn.

Subtle Computing đã nhận được $6 triệu trong vòng gọi vốn hạt giống, với sự dẫn đầu của Entrada Ventures cùng sự tham gia của Amplify Partners, Abstract Ventures và các nhà đầu tư cá nhân tên tuổi như Biz Stone (đồng sáng lập Twitter) và Evan Sharp (Pinterest). Công ty cũng được Qualcomm chọn là thành viên trong chương trình mở rộng giọng nói và âm nhạc, đảm bảo công nghệ của họ tương thích với chip của Qualcomm và có mặt trên các thiết bị từ các nhà sản xuất gốc (OEM).

Karen Roter Davis, Quản lý Đối tác tại Entrada Ventures, nhận định rằng việc Subtle Computing tập trung vào cách ly giọng nói mang đến một góc nhìn khác biệt, tạo ra trải nghiệm giọng nói đáng tin cậy và thú vị trong mọi điều kiện. Tin từ TechCrunch cho biết, công ty cũng đã hợp tác với một thương hiệu phần cứng tiêu dùng và một thương hiệu ô tô (giấu tên), đồng thời dự kiến công bố một sản phẩm tiêu dùng riêng kết hợp cả phần cứng và phần mềm vào năm tới.


follow nhận tin mới

tin mới


Tin NỔI BẬT


Tin Chính trị


Tin Hoa Kỳ


Tin Di trú