임우형 LG AI연구원 공동 연구원장이 지난 9월 19일(현지시각) 영국 런던증권거래소에서 열린 엑사원 비즈니스 인텔리전스 상용화 서비스를 알리는 행사에서 관계자들과 기념사진을 찍고 있다

국내 국가대표 인공지능(AI) 도전 5개 팀의 주요 LLM과 챗GPT 등 해외 5개 모델에 수능 수학 20문제, 논술 30문제를 풀게 했다. 연구팀은 공통과목 확률과 통계 미적분 기하에서 가장 어려운 문항 5개씩을 뽑아 20문제를 설정했고 논술 문제는 국내 10개 대학 기출 문제와 인도 대학 입시 10문제 일본 도쿄대 공대 대학원 입시 수학 10문제 등 30문제를 설정해 총 50개 문제를 10개 모델에 풀게 했다. 한편 해외 모델은 76~92점을 받았고 한국 모델은 솔라 프로-2만 58점을 받았을 뿐 나머지는 20점대 낮은 점수를 기록했다. 라마 바르코 8B 인스트럭트는 2점으로 가장 낮은 점수를 받았다. 연구팀은 국내 5개 모델의 경우 단순 추론으로는 문제를 대부분 풀지 못해 파이선을 툴로 사용하도록 설계해 문제 적중률을 높였음에도 이런 결과가 나왔다. 연구팀은 대학교 수준부터 교수급 논문 연구 수준까지 난이도를 세분화한 자체 문제 세트 ‘엔트로피매스’ 100문제 중 10문제를 구성해 10개 모델에 문제를 풀게 했고 여기서도 해외 모델은 82점을 받았다. LG AI연구원 공동 연구원장 임우형은 9월 19일 영국 런던증권거래소에서 열린 엑사원 비즈니스 인텔리전스 상용화 서비스를 알리는 행사에서 관계자들과 기념사진을 찍었다.

@Meerae AI 빅데이터 연구소 meerae.info@gmail.com

Leave a Reply

Your email address will not be published. Required fields are marked *