네이버클라우드는 과학기술정보통신부 ‘독자 AI 파운데이션 모델’ 프로젝트의 첫 번째 성과로 텍스트·이미지·오디오 등 다양한 형태의 데이터를 동시에 이해하는 옴니모달 인공지능 파운데이션 모델을 개발했다. 이는 국내 최초 네이티브 옴니모달 구조를 적용한 ‘하이퍼클로바 X 시드 8B 옴니’를 오픈소스로 공개한 것이다.
또한 기존 하이퍼클로바X 기능을 확대한 ‘고성능 추론모델’도 함께 발표했다. 이 모델은 자체 추론형 AI에 시각 이해 및 음성 대화, 도구 활용 능력을 결합해 복합적인 입력과 요청을 이해하고 문제를 해결할 수 있다.
아티피셜 애널리시스가 종합 지식·고난도 추론·코딩·에이전트형 과제 등 10개 주요 벤치마크를 종합해 산출한 지수 기준에서 이 모델들은 글로벌 주요 AI 모델들과 유사한 성능 범위에 포함됐다.
이 모델들은 텍스트 지시를 기반으로 이미지를 생성·편집하는 옴니모달 생성 기능도 갖추고 있으며, 텍스트와 이미지의 맥락을 함께 이해해 의미를 반영한 결과물을 만들어낸다.
올해 대학수학능력시험 문제를 풀이한 결과, 국어·수학·영어·한국사 등 주요 과목에서 모두 1등급을 기록했으며, 영어와 한국사에서는 만점을 기록했다.
성 총괄은 “텍스트·시각·음성 등 AI의 감각을 수평적으로 확장하는 동시에 사고와 추론 능력을 함께 강화했을 때 현실 문제 해결력이 크게 높아진다는 점을 확인했다”며 “검색과 커머스, 콘텐츠 등 다양한 영역에서 활용할 수 있는 AI 에이전트를 단계적으로 확장할 계획”이라고 말했다.
@Meerae AI 빅데이터 연구소 meerae.info@gmail.com
