📝기사 요약
주제: 모델, 솔라, 오픈, 레이어놈, 업스테이지

고대표는 레이어놈 레이어 값의 코사인 유사도만으로는 모델 웨이트 공유 여부를 결론 내리기 어렵다고 밝혔습니다.
고대표는 해당 근거를 보다 엄밀하게 검증하지 않은 채 공개함으로써 불필요한 혼란과 논란을 야기한 점에 대해 진심으로 사과드렸습니다.
김성훈 업스테이지 대표는 레이어놈의 유사성을 근거로 모델 가중치를 공유했다고 주장한 것은 통계적 착시라고 반박했습니다.
해당 구간은 모델 전체의 0.0004%에 불과한 미세 영역으로 솔라 오픈의 99.9996%는 다른 모델과 완전히 상이하다고 설명했습니다.
김 대표는 코사인 유사도는 벡터의 방향만 비교하는 단순 지표로, 통상 언어모델의 레이어놈은 비슷한 구조와 특성을 공유하기 때문에 독립적인 모델 간 유사도가 높은 건 자연스러운 현상이라고 말했습니다.
김 대표는 솔라 오픈이 GLM-4.5-에어의 토크나이저를 사용했다는 주장 역시 사실이 아니라고 설명했습니다.
GLM의 어휘 수는 약 15만 개, 솔라 오픈은 19만 6천 개로 공통 어휘는 약 8만 개에 불과합니다.
통상 동일 계열 토크나이저라면 70% 이상이 중복되는 게 일반적입니다.
김 대표는 의견을 주고받는 건강한 토론은 환영하지만, 허위 사실을 단정적으로 전달하는 행위는 AI 3강을 향해 최선을 다하는 업스테이지와 정부 노력의 의미를 훼손하는 것이라고 말했습니다.
배경훈 부총리 겸 과학기술정보통신부 장관은 AI 업계를 달군 기술적 논쟁을 지켜보며 대한민국 AI의 밝은 미래를 보았다고 말했습니다.
배 장관은 사이오닉AI 대표의 사과를 보면 이렇게 K-AI가 발전한다는 생각이 들었다고 말했습니다.
배 장관은 의혹 제기는 할 수 있는 것이고 의혹 제기를 공개 검증으로 증명한 업스테이지

@Meerae AI 빅데이터 연구소 meerae.info@gmail.com

Leave a Reply

Your email address will not be published. Required fields are marked *