OpenAI đang dồn nhiều nguồn lực vào công nghệ trí tuệ nhân tạo (AI) trong lĩnh vực âm thanh, với mục tiêu không chỉ cải thiện chất lượng âm thanh của ChatGPT. Theo thông tin từ The Information, OpenAI đã tập hợp các nhóm kỹ sư, sản phẩm và nghiên cứu để nâng cấp các mô hình âm thanh của mình. Động thái này được chuẩn bị cho một thiết bị cá nhân tập trung vào âm thanh, dự kiến ra mắt trong khoảng một năm tới.
Động thái này cho thấy xu hướng chung của ngành công nghệ, nơi màn hình đang dần trở nên thứ yếu, nhường chỗ cho âm thanh. Loa thông minh đã trở thành một phần không thể thiếu trong hơn một phần ba hộ gia đình tại Hoa Kỳ. Meta cũng đã tung ra một tính năng mới cho kính thông minh Ray-Ban, sử dụng một hệ thống năm micro để giúp người dùng nghe rõ hơn trong môi trường ồn ào. Google thì đang thử nghiệm “Tổng quan âm thanh” để chuyển đổi kết quả tìm kiếm thành các bản tóm tắt bằng giọng nói. Tesla cũng đang tích hợp Grok và các mô hình ngôn ngữ lớn (LLM) khác vào xe hơi của mình để tạo ra trợ lý giọng nói có thể xử lý mọi thứ từ điều hướng đến điều khiển khí hậu thông qua đối thoại tự nhiên.
Không chỉ các gã khổng lồ công nghệ mới đặt cược vào xu hướng này. Một số công ty khởi nghiệp cũng đang phát triển các sản phẩm tương tự, mặc dù với những thành công khác nhau. Humane AI Pin đã đốt hàng trăm triệu đô la trước khi sản phẩm đeo không màn hình của họ trở thành một bài học cảnh tỉnh. Friend AI, một mặt dây chuyền ghi lại cuộc sống và cung cấp tình bạn, đã gây ra những lo ngại về quyền riêng tư. Ít nhất hai công ty khác, bao gồm Sandbar và một công ty do nhà sáng lập Pebble, Eric Migicovsky, dẫn dắt, đang phát triển nhẫn AI, dự kiến ra mắt vào năm 2026, cho phép người dùng giao tiếp bằng giọng nói.
Dù hình thức có khác nhau, nhưng mục tiêu là như nhau: âm thanh là giao diện của tương lai. Mọi không gian—nhà của bạn, xe hơi của bạn, thậm chí cả khuôn mặt của bạn—đang trở thành một giao diện. Mô hình âm thanh mới của OpenAI, dự kiến ra mắt vào đầu năm 2026, được cho là sẽ có âm thanh tự nhiên hơn, xử lý các tình huống bị gián đoạn như một người bạn trò chuyện thực sự và thậm chí có thể nói chuyện trong khi bạn đang nói. Công ty cũng dự kiến sẽ phát triển một loạt các thiết bị, có thể bao gồm kính hoặc loa thông minh không màn hình, hoạt động như những người bạn đồng hành hơn là công cụ.
Theo The Information, cựu Giám đốc thiết kế của Apple, Jony Ive, người đã tham gia vào các nỗ lực phần cứng của OpenAI thông qua việc công ty mua lại công ty của ông với giá 6,5 tỷ đô la, đã ưu tiên giảm thiểu sự lệ thuộc vào thiết bị, coi thiết kế tập trung vào âm thanh là cơ hội để “sửa chữa những sai lầm” của các thiết bị tiêu dùng trước đây.
Tin từ TechCrunch.



































