Ngoài ra, Mô hình o3 của OpenAI gây tranh cãi vì điểm benchmark thấp hơn công bố ban đầu