Trong nỗ lực không ngừng nâng cao khả năng của trí tuệ nhân tạo, OpenAI đã giới thiệu o3 và o4-mini, hai mô hình AI mới thuộc dòng "lý luận". Khác với các mô hình tạo sinh thông thường trả lời gần như tức thì, các mô hình lý luận này được lập trình để thực hiện một chuỗi tư duy nội bộ, phân tích và giải quyết vấn đề từng bước trước khi đưa ra câu trả lời cuối cùng, giúp tăng độ chính xác và khả năng xử lý các yêu cầu phức tạp.
OpenAI gọi o3 là mô hình lý luận tiên tiến nhất từ trước đến nay của hãng, khẳng định nó vượt trội hơn các mô hình trước đó trong các bài kiểm tra đo lường khả năng toán học, lập trình, suy luận logic, khoa học và cả hiểu biết về hình ảnh. Trong khi đó, o4-mini được định vị là lựa chọn cân bằng tối ưu giữa chi phí, tốc độ và hiệu năng – những yếu tố quan trọng mà các nhà phát triển thường cân nhắc khi chọn mô hình AI cho ứng dụng của mình. Bên cạnh đó, còn có biến thể o4-mini-high, một phiên bản của o4-mini dành nhiều thời gian xử lý hơn để tăng độ tin cậy cho câu trả lời.
Năng lực mới vượt trội
Một bước tiến lớn của o3 và o4-mini so với các mô hình lý luận trước đây là khả năng sử dụng trực tiếp các công cụ có sẵn trong ChatGPT để tạo phản hồi. Chúng có thể tự động duyệt web để tìm thông tin mới nhất, thực thi mã Python thông qua tính năng Canvas, xử lý hình ảnh và thậm chí tạo ra hình ảnh mới.
Đặc biệt, o3 và o4-mini là những mô hình đầu tiên của OpenAI có khả năng "suy nghĩ bằng hình ảnh" (think with images). Người dùng có thể tải lên các hình ảnh như bản phác thảo trên bảng trắng hay sơ đồ từ file PDF, và các mô hình này sẽ phân tích chúng trong quá trình "suy nghĩ" của mình trước khi trả lời. Chúng có thể hiểu được cả những hình ảnh mờ, chất lượng thấp và thực hiện các thao tác như phóng to, xoay ảnh trong khi đang lý luận.

Các mô hình mới của OpenAI có khả năng lập luận từ hình ảnh. Ảnh: OpenAI
Hiệu năng ấn tượng và giá cả cạnh tranh
Về hiệu năng, OpenAI cho biết o3 đạt kết quả hàng đầu (state-of-the-art) trong bài kiểm tra năng lực lập trình SWE-bench verified với điểm số 69.1%. Mô hình o4-mini cũng đạt hiệu năng tương tự với 68.1%, vượt xa đáng kể so với mô hình o3-mini trước đó (49.3%) và cả đối thủ Claude 3.7 Sonnet (62.3%).

o3 và o4-mini có hiệu năng vượt trội so với các mô hình cũ của OpenAI. Ảnh: OpenAI
Bối cảnh cạnh tranh
Việc ra mắt o3 và o4-mini diễn ra trong bối cảnh cuộc đua AI toàn cầu ngày càng khốc liệt. Sau khi OpenAI tiên phong với mô hình lý luận o1, các đối thủ như Google, Meta, xAI, Anthropic, DeepSeek đã nhanh chóng tung ra các phiên bản cạnh tranh, thậm chí vượt trội hơn. Các mô hình lý luận đang dần trở thành xu thế chủ đạo. Đáng chú ý, CEO Sam Altman vào tháng 2 từng úp mở về việc tập trung nguồn lực cho một giải pháp phức tạp hơn thay vì phát hành o3 độc lập, nhưng áp lực cạnh tranh dường như đã khiến OpenAI thay đổi quyết định.
Hiện tại, người dùng các gói ChatGPT Pro, Plus và Team đã có thể trải nghiệm o3, o4-mini và o4-mini-high. Trong vài tuần tới, OpenAI dự kiến phát hành thêm o3-pro, phiên bản mạnh hơn của o3 dành riêng cho thuê bao ChatGPT Pro.

Người dùng gói Plus, Pro đã có thể trải nghiệm o3 và o4-mini trên ChatGPT
Sam Altman cũng đã úp mở rằng o3 và o4-mini có thể là những mô hình lý luận độc lập cuối cùng xuất hiện trên ChatGPT trước khi GPT-5 ra mắt. Mô hình thế hệ tiếp theo này được kỳ vọng sẽ hợp nhất khả năng của các mô hình truyền thống (như GPT-4.1) với các mô hình lý luận tiên tiến, tạo ra một bước nhảy vọt mới về năng lực AI.
Sự xuất hiện của o3 và o4-mini rõ ràng đã nâng cấp đáng kể khả năng suy luận, xử lý đa phương thức và tích hợp công cụ của ChatGPT, giúp OpenAI củng cố vị thế cạnh tranh và đồng thời hé lộ những bước đi tiếp theo hướng tới các mô hình AI toàn diện và mạnh mẽ hơn trong tương lai.
Theo The Verge