OpenAI vừa công bố các bản cập nhật API mới tại Dev Day, giới thiệu GPT-5 Pro, mô hình ngôn ngữ mới nhất, mô hình tạo video Sora 2 và mô hình giọng nói nhỏ hơn, rẻ hơn. Các bản cập nhật này nằm trong một loạt các thông báo nhằm thu hút các nhà phát triển đến với hệ sinh thái của OpenAI, bao gồm ra mắt công cụ xây dựng tác nhân và khả năng xây dựng ứng dụng trong ChatGPT.
GPT-5 Pro có thể hấp dẫn các nhà phát triển xây dựng ứng dụng trong lĩnh vực tài chính, pháp lý và y tế – những ngành đòi hỏi “độ chính xác cao và khả năng suy luận sâu sắc”, theo lời Tổng Giám Đốc OpenAI, Sam Altman. OpenAI cũng ra mắt “gpt-realtime mini”, một mô hình giọng nói nhỏ hơn, rẻ hơn trong API, hỗ trợ tương tác phát trực tuyến độ trễ thấp cho âm thanh và giọng nói. Mô hình mới này rẻ hơn 70% so với mô hình giọng nói nâng cao trước đây của OpenAI nhưng hứa hẹn “chất lượng giọng nói và khả năng biểu cảm tương đương”.
Ngoài ra, những nhà sáng tạo tham gia vào hệ sinh thái nhà phát triển của OpenAI hiện có thể khai thác Sora 2 trong bản xem trước API. Sora 2 xây dựng dựa trên thế hệ trước với các cảnh thực tế hơn, nhất quán về mặt vật lý với âm thanh được đồng bộ hóa và khả năng kiểm soát sáng tạo lớn hơn – từ hướng máy ảnh chi tiết đến hình ảnh cách điệu. Ông Altman cho biết: “Giờ đây, các nhà phát triển có quyền truy cập vào cùng một mô hình cung cấp năng lượng cho video tuyệt đẹp của Sora 2 ngay trong ứng dụng của riêng bạn”.
Sora 2 được giới thiệu như một công cụ để phát triển ý tưởng, cho dù đó là điểm khởi đầu trực quan cho một quảng cáo dựa trên cảm nhận chung về một sản phẩm hay nhà thiết kế Mattel biến một bản phác thảo thành một ý tưởng đồ chơi. TechCrunch cho biết thêm, sự kiện này hé lộ về thỏa thuận của OpenAI với nhà sản xuất búp bê Barbie nhằm đưa AI tạo sinh vào quy trình sản xuất đồ chơi.