OpenAI vừa tung ra phiên bản mới nhất của mô hình tạo ảnh bằng trí tuệ nhân tạo (AI), mang tên GPT-Image Model 1.5. Công ty cho biết bản nâng cấp này có khả năng tuân theo các chỉ dẫn tốt hơn và tạo ra những hình ảnh chi tiết hơn.
Người dùng ChatGPT trên toàn cầu có thể trải nghiệm mô hình mới này ngay từ hôm nay. Nó cũng có sẵn trong API với tên gọi GPT-Image-1.5. Một điểm nổi bật là sự xuất hiện của một không gian chuyên biệt trong ChatGPT, được thiết kế riêng để tạo ảnh, với các phong cách cài đặt sẵn và các thiết kế theo xu hướng, đây là một bước tiến lớn so với việc chỉ sử dụng giao diện trò chuyện để tạo ảnh.
Fidji Simo, Giám đốc điều hành của OpenAI, cho biết: “Việc tạo và chỉnh sửa hình ảnh là một tác vụ khác biệt và xứng đáng có một không gian được xây dựng dành riêng cho hình ảnh.”
Mô hình mới được cho là nhanh hơn gấp bốn lần so với phiên bản trước và có khả năng tuân theo các hướng dẫn và xử lý chỉnh sửa chính xác hơn. Người dùng có thể sử dụng các công cụ chỉnh sửa để thêm các đối tượng cụ thể, thay đổi kiểu dáng của các đối tượng, thử quần áo và loại bỏ các yếu tố không mong muốn.
GPT-Image-1.5 còn được cải thiện về khả năng tạo văn bản rõ ràng trong hình ảnh AI. Đây là một thách thức lớn đối với các mô hình tạo ảnh, ngay cả thế hệ đầu tiên của mô hình OpenAI cũng gặp khó khăn với điều này. Các hình ảnh thử nghiệm được tạo bằng 1.5 dường như cho thấy những cải tiến, nhưng chúng ta cần phải chờ xem kết quả kiểm tra thực tế.
Những cải tiến này là một bước tiến quan trọng so với mô hình ban đầu. Phiên bản đầu tiên chậm hơn đáng kể so với các đối thủ cạnh tranh và thiếu các công cụ chỉnh sửa cần thiết để tinh chỉnh hình ảnh.
Việc ra mắt mô hình mới diễn ra sau khi Disney và OpenAI đạt được thỏa thuận, mang hơn 200 nhân vật mang tính biểu tượng của Disney vào hình ảnh ChatGPT và video Sora AI. Tuy nhiên, người dùng chưa thể sử dụng mô hình mới để tạo ra các nhân vật Disney, tính năng này dự kiến sẽ ra mắt vào đầu năm 2026.
Sự ra mắt của mô hình mới diễn ra trong bối cảnh Google tung ra nano banana pro, phiên bản cập nhật của công cụ tạo ảnh AI, với khả năng tạo ra những hình ảnh siêu thực tế với văn bản rõ ràng, đánh dấu một bước tiến lớn trong lĩnh vực này. Điều này cũng làm dấy lên lo ngại về việc ngày càng khó để xác định nội dung do AI tạo ra.
Theo tin tức từ CNET, OpenAI đang nỗ lực để cạnh tranh với Google trong lĩnh vực AI.







































