사진은 기사와 직접 관련 없음. [

오픈AI는 11일(현지시간) 차세대 AI 모델 GPT-5.2를 공개하고 유료 사용자 대상으로 배포를 시작했다.

GPT-5.2는 즉답·사고·프로의 세 가지 모드로 구성됐다. 즉답 모드는 일상적인 업무와 학습에 필요한 빠른 응답에 초점을 맞췄고, 사고 모드는 코딩·수학 문제·긴 문서 요약 등 복잡한 작업에 적합하도록 설계됐다.

프로 모드는 장시간 작업과 추론이 필요한 고난도 질문을 처리하는 데 활용된다. 오픈AI는 새 모델이 수학·과학·코딩 능력을 평가하는 주요 지표에서 최고 성능을 기록했다고 밝혔다.

GPT-5.2 사고 모드는 GDPval 평가에서 70.9%를 기록했고, 프로 모드는 74.1%를 기록했다. 최고의 실무 능력을 보유한 인간을 100%로 봤을 때 중상위권 전문가들과 대등한 수준까지 올라왔다.

이전 버전인 GPT-5 사고 모드의 평가 점수는 38.8%였던 점을 감안하면 거의 두 배 높은 성적을 거뒀다.

GPT-5.2는 소프트웨어 공학 능력을 평가하는 SWE 벤치마크에서 80.0%를 기록해 제미나이 3.0 프로(76.2%)보다 앞섰다.

코딩 능력이 뛰어난 앤스로픽의 클로드 오퍼스 4.5(80.9%)와도 동등한 수준이 됐다.

GPT-5.2 프로 모드는 검색 등의 도구를 사용해 진행한 평가에서 50.0%를 기록했고, 제미나이 3.0 프로 모드는 45.8%를 기록했다.

샘 올트먼 오픈AI 최고경영자(CEO)는 CNBC와의 인터뷰에서 “경쟁 위협이 발생하면 빠르게 대응하는 것이 중요하다”며 “내년 1월이면 코드 레드를 종료할 수 있을 것”이라고 말했다.

오픈AI는 GPT-5.2가 “실제 업무 환경에서 활용되는 지식 노동에 가장 적합한 자사 최고 수준의 AI”라고 설명했다.

스프레드시트 작성, 프레젠테이션 제작, 이미지 인식, 긴 문맥 이해 능력에서 성능이 크게 개선됐

@Meerae AI 빅데이터 연구소 meerae.info@gmail.com

Leave a Reply

Your email address will not be published. Required fields are marked *