김성훈 대표 공개 검증 [/유튜브 캡처]
📝기사 요약
주제: 부산광역시, 사하구, 솔라, 모델, 오픈

업스테이지가 중국 AI 모델 도용 논란에 대해 정면 반박했다. 고석현 사이오닉AI CEO가 솔라 오픈이 지푸AI의 GLM-4.5-에어에서 파생됐다고 주장한 후, 업스테이지 김성훈 대표는 해당 주장이 사실이 아니라고 명확히 밝혔다.

김성훈 대표는 “솔라 오픈이 중국 모델을 복사해 미세 조장한 결과물이라는 주장은 사실과 다르다”라며 “프롬 스크래치 방식으로 학습됐다”고 해명했다. 프롬 스크래치는 AI 모델 맨 첫 단계부터 모두 직접 구축하는 방식을 의미한다.

김 대표는 학습 과정을 공개 검증을 통해 검증했다. 솔라 오픈 학습에 사용한 체크포인트와 WandB 실험 기록을 공개하며, “프롬스크래치 여부를 판단할 수 있는 여부는 로스인데 로스Loss가 높다는 건 처음에 학습이 안 됐다는 것을 의미한다”라며 “솔라 오픈은 초기 높은 로스로부터 학습됐다”고 설명했다.

또한 김 대표는 “MMLU는 AI 모델의 성능을 나타내는 지표인데 초기 낮은 수치에서 출발해서 학습이 진행될수록 성능이 올라갔다”라고 강조했다.

레이어놈LayerNorm이 GLM-4.5-에어와 유사하다는 주장에 대해 김 대표는 “솔라, GLM, 파이Pi의 유사도를 측정했을 때도 높은 값이 나온다”라며 “사이오닉 AI가 제시한 지표가 아닌 다른 지표로 보면 솔라와 GLM-4.5-에어는 유사성이 낮다”라고 반박했다.

모델 구조가 유사하다는 주장에 대해서는 “대형언어모델LLM 서빙 툴과 생태계 호환성을 확보하려면 구조가 어느 정도 비슷해질 수밖에 없다”라며 “사용성과 호환성을 고려한 설계와 LLM 오픈소스 생태계 교류의 결과다”라고 설명했다.

그러면서 “솔라는 밀집 레이어가 없고 GLM은 덴스 레이어가 있어 모델 구조가 다르다”라고 부연했다.

김 대표는 “솔라 오픈은 레이어놈을 포함해 모델 전체가 새로운 모델이다”라며 “솔라 오픈은 다른 모델의 파생이 아닌 프롬 스크래치로 만든 모델이다”라며 재차 강조했다.

업스테이지가 라이선스를 고쳤다는 의혹에 대해서는 “학습과는 관련이 없으며, 서비스 호환성을 높이기 위해 사용한 오픈소스에 대해 출처 표기를 명확히 한 것”이라고 반박했다.

@Meerae AI 빅데이터 연구소 meerae.info@gmail.com

Leave a Reply

Your email address will not be published. Required fields are marked *