OpenAI chính thức phát hành GPT-5.5 vào ngày 23 tháng 4 năm 2026, một mô hình AI mới được thiết kế để hiểu ý định người dùng trong các ứng dụng thực tế thông qua khả năng sử dụng máy tính một cách bản địa. Mô hình có các năng lực bản địa đa dụng cho phép nó điều hướng các ứng dụng máy tính để bàn, nhấp vào các nút và nhập văn bản cho các quy trình làm việc nhiều bước, theo thông báo của OpenAI.
GPT-5.5 kết hợp việc sử dụng máy tính bản địa với lý luận nâng cao, tự chủ điều hướng các công cụ phần mềm cần thiết cho các tác vụ chuyên nghiệp cấp cao. Cửa sổ ngữ cảnh ~1,1 triệu token của mô hình cho phép nó xử lý các bộ dữ liệu tài chính khổng lồ mà trước đây cần phải chia thủ công thành từng phần. Nhóm tài chính của OpenAI đã dùng GPT-5.5 để rà soát 24.771 biểu mẫu thuế K-1 (71.637 trang) và hoàn thành nhiệm vụ nhanh hơn hai tuần so với năm trước.
GPT-5.5 đạt 88,5% trong các tác vụ mô hình hóa nội bộ về ngân hàng đầu tư và 60% trên benchmark FinancialAgent v1.1, vượt GPT-5.4 bốn điểm. Mô hình đạt 84,9% trên GDPval, kiểm tra khả năng của các tác nhân trong việc tạo ra các công việc tri thức cụ thể trên 44 nghề nghiệp. Trên OSWorld-Verified, đo các hoạt động vận hành máy tính thực tế tự chủ của mô hình, mô hình đạt 78,7%. GPT-5.5 đạt 98% trên Tau2-bench Telecom, kiểm tra các quy trình dịch vụ khách hàng cực kỳ khó.
Một nhân viên của nhóm Go-to-Market xác nhận rằng việc tự động hóa các báo cáo kinh doanh hằng tuần sẽ giúp tiết kiệm khoảng 5-10 giờ làm việc thủ công mỗi tuần.
OpenAI báo cáo rằng GPT-5.5 đã được dùng để giúp viết mã cho hạ tầng phục vụ của chính họ. Mô hình đạt “Tối ưu hóa cấp hệ thống” bằng cách phân tích các mẫu lưu lượng truy cập trong sản xuất để viết các quy tắc heuristic cân bằng tải tùy chỉnh, qua đó tăng tốc độ tạo token của chính nó lên 20%.
Trong một bài thử nghiệm dành cho nhà phát triển, mô hình được yêu cầu “tái kiến trúc một trình soạn thảo markdown” và trả về một stack 12-diff gần như hoàn chỉnh với ít chỉnh sửa của con người nhất. OpenAI lưu ý rằng mô hình mới đạt đáp án đúng trong ít lượt hơn và sử dụng ít hơn 40% token cho cùng các tác vụ Codex so với GPT-5.4.
Dan Shipper, người sáng lập và CEO của Every, mô tả GPT-5.5 là mô hình mã hóa đầu tiên có “sự rõ ràng về khái niệm nghiêm túc.” Shipper đã thử nghiệm GPT-5.5 sau khi anh và người kỹ sư giỏi nhất của mình dành nhiều ngày để gỡ lỗi một sự cố sau khi ra mắt trong một ứng dụng. Theo Shipper, GPT-5.5 đã đạt được điều mà GPT-5.4 không thể: nó xem xét đoạn mã bị hỏng và tạo ra bản viết lại mà người kỹ sư cuối cùng đã chọn. Mô hình có thể “ghi nhớ” và đối chiếu tham chiếu chéo toàn bộ các thư viện thông tin mà không bị mất vị trí, qua đó giảm các “ảo giác” đã ám ảnh các phiên bản trước.
OpenAI tuyên bố rằng GPT-5.5 được tối ưu cho “tự hiệu chỉnh” và tính tự chủ. Mô hình tốt hơn trong việc diễn giải các chỉ dẫn mơ hồ và sử dụng giao diện máy tính (clicking, typing, browsing) để hoàn thành các mục tiêu mà không cần sự can thiệp của con người. Mô hình trở nên đặc biệt hữu ích khi một tác nhân cần vận hành phần mềm, quản lý các quy trình làm việc nặng về terminal, hoặc lý luận xuyên suốt toàn bộ một codebase (500K+ tokens) với độ chính xác truy xuất cao.
Trong ChatGPT, OpenAI đã giới thiệu “GPT-5.5 Thinking”, mà công ty cho biết sẽ mở khóa trợ giúp nhanh hơn cho các vấn đề khó hơn. Tính năng này cung cấp các câu trả lời thông minh hơn, súc tích hơn để giúp người dùng hoàn thành các tác vụ phức tạp hiệu quả hơn. Nó nổi bật trong công việc chuyên nghiệp như tổng hợp và phân tích thông tin, viết mã, và các tác vụ nặng về tài liệu như nghiên cứu, đặc biệt khi sử dụng plugin.
Các nhà thử nghiệm Pro sớm của GPT-5.5 báo cáo mức cải thiện rất lớn cả về chất lượng lẫn độ khó của công việc mà ChatGPT có thể đảm nhận. Độ trễ thấp hơn khiến nó thực tế hơn cho các tác vụ đòi hỏi khắt khe so với GPT-5.4 Pro. Các phản hồi của GPT-5.5 Pro được cấu trúc tốt, phù hợp, hữu ích và chính xác, với hiệu suất đặc biệt mạnh trong các lĩnh vực luật, khoa học dữ liệu, kinh doanh và giáo dục.
Mặc dù có sẵn một phiên bản cơ bản, phiên bản có năng lực cao nhất (GPT-5.5 Pro) có giá 100 USD/tháng cho người đăng ký cá nhân. Đối với doanh nghiệp, chi phí cho mỗi token đầu ra xấp xỉ gấp đôi so với GPT-5.4, ngay cả khi hiệu quả token cao hơn 40%. Tổng chi tiêu cho các triển khai tác nhân quy mô lớn có thể sẽ rất đáng kể. Ngày càng có lo ngại rằng lý luận ở hạng cao nhất sẽ trở thành một “món xa xỉ” chỉ có thể tiếp cận với các công ty được tài trợ tốt, từ đó có thể làm gia tăng khoảng cách năng suất giữa các doanh nghiệp lớn và các startup nhỏ hơn.