챗GPT [로이터= 자료사진 제공]

오픈AI는 2022년 11일 현지시간에 차세대 AI 모델 ‘GPT-5.2’를 공개하고 유료 사용자 대상으로 배포를 시작했다.

GPT-5.2는 즉답, 사고, 프로의 세 가지 모드로 구성됐다. 즉답 모드는 일상적인 업무와 학습에 필요한 빠른 응답에 초점을 맞췄고, 사고 모드는 코딩이나 수학적 해결, 긴 문서 요약 등에 적합하다.

프로 모드는 보다 긴 작업시간을 필요로 하는 어려운 질문에 적합한 도구다.

오픈AI는 새 모델이 수학·과학·코딩 능력을 평가하는 주요 지표에서 최고 성능을 기록했다고 밝혔다.

전문 산업 현장 44개 직종의 업무 수행 능력을 평가하는 GDPval 평가에서 GPT-5.2 사고 모드는 70.9%, 프로 모드는 74.1%를 기록해 인간 전문가들과 대등하거나, 더 뛰어난 능력을 갖춘 것으로 평가됐다.

이전 버전인 GPT-5(38.8%)와 견줘 큰 폭의 성장을 보인 것이다.

소프트웨어 엔지니어링 능력을 평가하는 SWE 벤치마크에서는 80%를 기록해, 제미나이 3프로의 76.2%를 능가했다.

코딩 능력이 뛰어난 것으로 알려진 앤트로픽의 클로드 오퍼스4.5(80.9%)와 거의 차이가 없는 수준이다.

‘인간의 마지막 시험’으로 불리는 박사급 추론능력 측정 벤치마크 HLE에서도 구글의 최신 AI 모델을 넘어섰다.

별도 도구를 사용하지 않고 모델 자체의 능력만으로 진행한 평가에서는 GPT-5.2 프로는 36.6%로 제미나이3 프로의 37.5%보다 소폭 낮은 평가를 보였지만, 검색 등 도구를 사용해서 진행한 평가에서는 50%로 제미나이3 프로(45.8%)보다 더 높은 점수를 얻었다.

샘 올트먼 오픈AI 최고경영자(CEO)는 CNBC와의 인터뷰에서 “경쟁 위협이 발생하면 빠르게 대응하는 것이 중요하다”며 “내년 1월이면 코드 레드를 종료할 수 있을 것”이라고 말했다.

구글도 같은 날 제미나이의 심층연구용 에이전트를 선보였다.

**중요**: 본문은 2-3문장마다 단락을 나누세요 (

사용). 인용문은 별도 단락으로 구분하세요. 완벽한 온라인 기사 형식을 따르세요.

@Meerae AI 빅데이터 연구소 meerae.info@gmail.com

Leave a Reply

Your email address will not be published. Required fields are marked *