OpenAI cho ra mắt mô hình mới tập trung vào khả năng diễn giải prompt hình ảnh phức tạp
OpenAI vừa phát hành bản cập nhật mới cho công cụ tạo ảnh của ChatGPT. Công ty cho biết ChatGPT Images 2.0 đánh dấu sự thay đổi cơ bản trong cách chatbot AI xử lý các yêu cầu hình ảnh — giờ đây không còn dừng lại ở việc diễn giải nhanh, mà nó sẽ có thể xây dựng có chủ đích hơn. Trong buổi công bố trực tiếp, CEO Sam Altman và đội ngũ của ông nhấn mạnh rằng hình ảnh được tạo ra giờ đây sẽ giống như những câu trả lời thực sự — được hình thành từ sự hiểu biết về yêu cầu của người dùng, thay vì chỉ là một phiên bản xấp xỉ thiếu chính xác.

“Images 2.0 là một bước tiến vượt bậc,” Altman phát biểu. “Nó giống như bước nhảy từ GPT-3 lên thẳng GPT-5 trong một lần. Khả năng tạo ra những thứ cực kỳ đẹp của nó thật đáng kinh ngạc. Đội ngũ đã thực sự làm rất tốt với sản phẩm này, và chúng tôi rất nóng lòng chờ xem bạn sẽ làm gì với nó.”
Cải tiến rõ nét nhất xuất hiện ở chính những điểm từng là điểm yếu trước đó của OpenAI. Văn bản bên trong hình ảnh là ví dụ điển hình nhất. Poster, thực đơn, slide thuyết trình — và bất kỳ nội dung nào đòi hỏi chữ viết phải rõ ràng, dễ đọc — vốn là thách thức nan giải với các hệ thống trước đây. Các ký tự thường bị méo mó, khoảng cách lệch lạc, và ý nghĩa truyền đạt bị sai lệch theo đó, giờ đây đã được khắc phục tốt hơn nhiều.
