김성훈 대표 공개 검증 [/유튜브 캡처]
📝기사 요약
주제: 서울특별시, 강남구, 모델, 솔라, 도용

업스테이지가 중국 지푸AI의 GLM-4.5-에어 모델과의 도용 논란에 대해 정면 반박했다. 이에 따라 김성훈 대표는 2일 서울 강남 인근 사무실에서 ‘솔라 오픈’ 현장 검증회를 열어 학습 로그와 체크포인트 데이터를 공개했다. 이는 모델 설계도에 해당하는 내부 데이터를 투명하게 공개함으로써 ‘프롬 스크래치’ 진위 논란에 대응한 것이다.

김성훈 대표는 레이어놈 유사성에 대한 주장에 대해 “레이어놈 유사성은 모델 전체 약 0.0004%에 불과하다”고 밝혔다. 이는 솔라가 타 모델과 99.9996%가 상이하다는 역설적 지표를 제시한다. 또한 “코사인 유사도는 벡터 방향만 비교하는 단순 지표”라며 “통상 언어모델들의 레이어놈은 비슷한 구조와 특성을 공유한다”고 설명했다.

토크나이저 도용 주장에 대해서는 “솔라 오픈의 어휘 수는 19만6천 개로 비교 대상 모델인 15만 개와 차이가 크다”며 “공통 어휘는 41% 수준에 불과해 통상적인 동일 계열 모델의 중복률인 70%에 한참 못 미친다”고 반박했다.

소스코드 무단 사용 및 라이선스 조작 의혹에 대해서는 “외부 접근이 불가능한 학습 코드를 재사용한다는 주장은 기술적으로 성립할 수 없다”고 지적했고, “인퍼런스 코드는 서빙 호환성을 위해 ‘아파치 2.0 라이선스’에 따라 정당하게 활용한 것”이라고 설명했다.

김 대표는 “의견을 주고받는 건강한 토론은 환영하나 허위 사실을 단정적으로 전달하는 행위는 AI 3강을 향해 최선을 다하고 있는 기업과 정부 노력을 심각하게 훼손하는 것”이라고 지적했다. 이어 “앞으로 투명한 기술 공개 바탕으로 글로벌 최고 수준 기술력을 증명하고 국내 AI 생태계 확장에 힘쓰겠다”고 밝혔다.

@Meerae AI 빅데이터 연구소 meerae.info@gmail.com

Leave a Reply

Your email address will not be published. Required fields are marked *