오픈AI는 지난 11일(현지시간) 기존 즉답(Instant), 사고(Thinking) 모드에 프로(Pro) 모드를 더한 GPT-5.2 모델 시리즈를 유료 구독자용부터 순차적으로 출시했다.
GPT-5.2는 즉답 모드가 일상적인 업무와 학습을 위한 빠른 답변에 최적화되고, 사고 모드는 코딩이나 수학적 해결, 긴 문서 요약 등에 적합하다고 설명했다.
프로 모드는 보다 긴 작업시간을 필요로 하는 어려운 질문에 적합한 도구로 소개됐다.
전문 산업 현장 44개 직종의 업무 수행 능력을 평가하는 GDPval 평가에서 GPT-5.2 사고 모드는 70.9%, 프로 모드는 74.1%를 기록해 인간 전문가들과 대등하거나, 더 뛰어난 능력을 갖춘 것으로 평가됐다.
이전 버전인 GPT-5(38.8%)과 견줘 큰 폭의 성장을 보였다.
소프트웨어 엔지니어링 능력을 평가하는 SWE 벤치마크에서는 GPT-5.2가 80.0%를 기록해, 제미나이 3프로의 76.2%를 능가했다.
코딩 능력이 뛰어난 앤트로픽의 클로드 오퍼스4.5(80.9%)와 거의 차이가 없는 수준이다.
구글의 최신 AI 모델을 넘어선 ‘인간의 마지막 시험’으로 불리는 박사급 추론능력 측정 벤치마크 HLE에서도 구글의 최신 AI 모델을 넘어섰다.
구글도 같은 날 제미나이의 심층연구용 에이전트를 선보이며 맞불을 놨다.
오픈AI는 새 버전이 추론과 코딩 능력을 강화하고 환각을 줄였으며, AI 성능을 측정하는 다양한 벤치마크에서 최고 수준을 달성했다고 강조했다.
**중요**: 오픈AI는 연구·로드맵 어느 때보다 낙관적…10년 안에 초지능 구현 확신…
**중요**: 우리 연구와 제품 로드맵, 미션에 대한 전망에 대해 어느 때보다 낙관적…
**중요**: 10년 안에 우리가 초지능을 구현할 것이 거의 확실하다고 믿는다…
**중요**: 2035년의 사람들은 우리가 쉽게 상상할 수 없는 일을 해낼 수 있을 것…
**중요**: 일상생활과 우리가 가장 중요하게 여기는 것들은 거의 변하지 않을 것…
@Meerae AI 빅데이터 연구소 meerae.info@gmail.com
