김성훈 대표 공개 검증 [/유튜브 캡처]
📝기사 요약
주제: 서울특별시, 경기도, 강남구, 여주시, 모델

업스테이지는 최근 제기된 자사 AI 모델 ‘솔라 오픈’에 대한 중국 지푸에이아이의 ‘지엘엠 4.5 에어’와의 유사성 논란에 대해 2일 서울 강남구 모처에서 현장 검증회를 열고 정면으로 반박했다.
이날 김성훈 업스테이지 대표는 모델 학습 로그와 체크포인트 등 개발 관련 주요 데이터를 공개하고, 유사하다고 주장하는 구간이 모델 전체의 0.0004%에 불과하다고 밝혔다.
김성훈 대표는 “일부에서 제기한 레이어정규화 유사성을 근거로 타 모델의 가중치를 재사용했다는 주장은 통계적 착시에 불과하다”면서 “해당 구간은 모델 전체의 약 0.0004%에 불과한 미세 영역으로, 오히려 솔라 오픈의 99.9996%가 타 모델과 완전히 상이함을 보여주는 역설적 지표”라고 말했다.
또 레이어정규화 유사성 판단에 사용된 코사인 유사도 역시 적절한 비교 기준이 아니라고 설명했다. 코사인 유사도는 통상 언어모델들의 레이어정규화와 비슷한 구조와 특성을 공유하기 때문에 독립적인 모델 간 유사도가 높은 값으로 나오는 것이 오히려 자연스러운 현상이라는 것이다.
업스테이지는 정규화를 통한 모델 특성을 반영하는 ‘피어슨 상관계수’로 재분석한 결과 솔라 오픈과 타 모델 간 패턴이 전혀 일치하지 않는다고 증명했다. 이는 솔라 오픈이 타 모델의 가중치를 재사용하지 않은 독립적 모델임을 뒷받침하는 명확한 통계적 근거다.
김성훈 대표는 “의견을 주고 받는 건강한 토론은 환영하나 이와 같은 허위 사실을 단정적으로 전달하는 행위는 AI3강을 향해 최선을 다하고 있는 업스테이지와 정부 노력의 의미를 심각하게 훼손하는 것”이라며 “앞으로도 업스테이지는 투명한 기술 공개를 바탕으로 글로벌 최고 수준의 기술력을 증명하고 국내 AI생태계 확장에 힘쓰겠다”고 밝혔다.
또 솔라 오픈의 학습 단계별 저장 자료와 실험 기록을 공개하며 “학습 초반 높은 오차 수준에서 출발했는데, 이는 기존 학습 없이 모델을 처음부터 학습했다는 의미”라고 설명했다.
뒤늦게 라이선스를 고쳤다는 의혹에 대해서도 “학습과는 관련이 없으며, 서비스 호환성을 높이기 위해 사용한 오픈소스에 대해 출처 표기를 명확히 한 것”이라고 반박했다.

@Meerae AI 빅데이터 연구소 meerae.info@gmail.com

Leave a Reply

Your email address will not be published. Required fields are marked *