사이오닉AI 고석현 대표는 레이어놈 레이어 값의 코사인 유사도만으로 모델 가중치 공유 여부를 결론 내리기 어렵다고 지적하며 “해당 근거를 엄밀하게 검증하지 않은 채 공개해 불필요한 혼란과 논란을 야기한 점에 대해 진심으로 사과한다”고 밝혔다. 이는 지난 1일 소셜미디어를 통해 제기된 솔라 오픈 100B와 지푸AI의 GLM-4.5-에어 사이의 레이어 유사성 논란에 대한 반응이다.
업스테이지 김성훈 대표는 2일 서울 강남구에서 열린 공개 검증회에서 “솔라 오픈 100B는 토대부터 자체 설계한 독자 AI 모델”이라고 밝혔다. 그는 레이어놈 유사성을 근거로 모델 가중치 재사용을 주장한 것은 통계적 착시에 불과하다고 설명하며, 문제가 된 구간이 전체 모델의 약 0.0004%에 불과하다고 강조했다. 이에 따라 솔라 오픈 100B의 나머지 99.9996%는 중국 모델과 구조적으로 다르다는 점을 지적했다.
또한 고석현 대표가 제기한 토크나이저 사용 주장에 대해 김 대표는 GLM-4.5-에어의 어휘 수가 약 15만 개에 불과하고, 솔라 오픈의 어휘 수는 약 19만 6천 개이며 공통 어휘도 약 8만 개에 그친다고 반박했다. 이에 따라 두 모델이 동일한 토크나이저로 보기 어렵다는 설명을 추가했다.
업스테이지는 피어슨 상관계수를 활용해 모델 패턴의 일치 여부를 재분석했으며, 솔라 오픈100B와 GLM-4.5-에어의 패턴이 전혀 일치하지 않음을 증명했다고 밝혔다. 이에 따라 고석현 대표는 3일 공개 사과문을 올렸고, 논란은 이날 일단락됐다.
과학기술정보통신부 배경훈 부총리 겸 장관은 SNS를 통해 “특정 모델의 개발 방식에 대한 데이터 기반의 분석과 이에 대해 공개 검증으로 답하는 기업의 모습은 우리 AI 생태계가 이미 글로벌 수준의 ‘ усили’와 ‘기술적 투명성’을 갖췄음을 보여준다”고 말했다. 그는 “성장통 없는 혁신은 없다”고 강조하며, 독자 AI 파운데이션 모델 사업에 참여한 5개 정예팀에 대한 평가는 이달 15일까지 진행된다.
이 사안은 기업 간 기술적 투명성과 공개 검증 절차의 실현을 보여주는 사례로, 정부는 이를 공정한 심판이자 든든한 페이스메이커로서 역할을 충실히 해 나가겠다고 밝혔다.
@Meerae AI 빅데이터 연구소 meerae.info@gmail.com
