챗GPT[로이터= 자료사진. 재판매 및 DB 금지]

구글의 추격을 받는 챗GPT 개발사 오픈AI가 이전 버전을 내놓은 지 불과 한 달 만에 새 인공지능(AI) 모델 ‘GPT-5.2’를 내놨다.

구글도 같은 날 제미나이의 심층연구용 에이전트를 선보이며 맞불을 놓았다.

오픈AI는 전문적인 지식 업무 수행에 가장 뛰어난 모델 GPT-5.2 시리즈를 출시한다고 11일(현지시간) 밝혔다.

GPT-5.2는 이전의 즉답(Instant), 사고(Thinking) 모드에 프로 모드를 더해 모두 세 가지 모드로 구성됐다.

즉답 모드는 일상적인 업무와 학습을 위한 빠른 답변에 최적화했고, 사고 모드는 코딩이나 수학적 해결, 긴 문서 요약 등에 적합하다.

또 프로 모드는 보다 긴 작업시간을 필요로 하는 어려운 질문에 적합한 도구라고 오픈AI는 소개했다.

오픈AI는 새 버전이 추론과 코딩 능력을 강화하고 환각을 줄였으며, AI 성능을 측정하는 다양한 벤치마크에서 최고 수준을 달성했다고 강조했다.

전문 산업 현장 44개 직종의 업무 수행 능력을 평가하는 GDPval 평가에서 GPT-5.2 사고 모드는 70.9%, 프로 모드는 74.1%를 기록해 인간 전문가들과 대등하거나, 더 뛰어난 능력을 갖춘 것으로 평가됐다.

이전 버전인 GPT-5(38.8%)와 견줘 큰 폭의 성장을 보인 것이다.

소프트웨어 엔지니어링 능력을 평가하는 SWE 벤치마크에서는 80%를 기록해, 제미나이 3프로의 76.2%를 능가했다.

코딩 능력이 뛰어난 것으로 알려진 앤트로픽의 클로드 오퍼스4.5(80.9%)와 거의 차이가 없는 수준이다.

‘인간의 마지막 시험’으로 불리는 박사급 추론능력 측정 벤치마크 HLE에서도 구글의 최신 AI 모델을 넘어섰다.

별도 도구를 사용하지 않고 모델 자체의 능력만으로 진행한 평가에서는 GPT-5.2 프로는 36.6%로 제미나이3 프로의 37.5%보다 소폭 낮은 평가를 보였지만, 검색 등 도구를 사용해서 진행한 평가에서는 50%로 제미나이3 프로(45.8%)보다 더 높은 점수를 얻었다.

올트먼 “연구·로드맵 어느 때보다 낙관적…10년 안에 초지능 구현 확신…”

올트먼 “우리 연구와 제품 로드맵, 미션에 대한 전망에 대해 어느 때보다 낙관적…”

올트먼 “10년 안에 우리가 초지능을 구현할 것이 거의 확실하다고 믿는다…”

올트먼 “2035년의 사람들은 우리가 쉽게 상상할 수 없는 일을 해낼 수 있을 것…”

올트먼 “일상생활과 우리가 가장 중요하게 여기는 것들은 거의 변하지 않을 것…”

@Meerae AI 빅데이터 연구소 meerae.info@gmail.com

Leave a Reply

Your email address will not be published. Required fields are marked *