오픈AI는 2022년 11월(현지시간) 기존 즉답(Instant), 사고(Thinking) 모드에 프로(Pro) 모드를 더한 GPT-5.2 모델 시리즈를 유료 구독자용부터 순차적으로 출시했다.
GPT-5.2는 즉답 모드가 일상적인 업무와 학습을 위한 빠른 답변에 최적화되고, 사고 모드는 코딩이나 수학적 해결, 긴 문서 요약 등에 적합하다고 설명했다.
프로 모드는 보다 긴 작업시간을 필요로 하는 어려운 질문에 적합한 도구로 소개됐다.
전문 산업 현장 44개 직종의 업무 수행 능력을 평가하는 GDPval 평가에서 GPT-5.2 사고 모드는 70.9%, 프로 모드는 74.1%를 기록해 인간 전문가들과 대등하거나, 더 뛰어난 능력을 갖춘 것으로 평가됐다.
소프트웨어 엔지니어링 능력을 평가하는 SWE 벤치마크에서는 80.0%를 기록해, 제미나이 3프로의 76.2%를 능가했다.
코딩 능력이 뛰어난 앤트로픽의 클로드 오퍼스4.5(80.9%)와 거의 차이가 없는 수준이다.
‘인간의 마지막 시험’으로 불리는 박사급 추론능력 측정 벤치마크 HLE에서도 구글의 최신 AI 모델을 넘어섰다.
구글도 같은 날 제미나이의 심층연구용 에이전트를 선보이며 맞불을 놓았다.
오픈AI는 새 버전이 추론과 코딩 능력을 강화하고 환각을 줄였으며, AI 성능을 측정하는 다양한 벤치마크에서 최고 수준을 달성했다고 강조했다.
**중요**: 오픈AI는 연구·로드맵 어느 때보다 낙관적…10년 안에 초지능 구현 확신이라고 밝혔다.
우리 연구와 제품 로드맵, 미션에 대한 전망에 대해 어느 때보다 낙관적이라고 말했다.
10년 안에 우리가 초지능을 구현할 것이 거의 확실하다고 믿는다.
2035년의 사람들은 우리가 쉽게 상상할 수 없는 일을 해낼 수 있을 것이라고 예측했다.
일상생활과 우리가 가장 중요하게 여기는 것들은 거의 변하지 않을 것이라고 말했다.
@Meerae AI 빅데이터 연구소 meerae.info@gmail.com
