이미지 확대보기김 대표는 2일 강남오피스에서 업계 및 정부 관계자 70여 명 대상의 현장 설명을 통해 “솔라 오픈이 중국 모델을 복사해 미세 조장한 결과물이라는 주장은 사실이 아니다”라며 사과를 촉구했다.
고 대표는 해당 게시글에서 “국민 세금이 투입된 프로젝트에서 중국 모델을 복사해 미세 조정한 결과물로 추정되는 모델이 제출된 건 상당히 큰 유감이다”라고 밝혀 화제를 모았다.
이에 김 대표는 “의견을 주고 받는 건강한 토론은 환영하나 이와 같은 허위 사실을 단정적으로 전달하는 행위는 AI3강을 향해 최선을 다하고 있는 업스테이지와 정부 노력의 의미를 심각하게 훼손하는 것”이라며 이날 솔라 오픈 모델 학습 로그와 체크포인트 등 개발 관련 주요 데이터를 모두 공개했다.
김 대표는 공개 검증에서 “일부에서 제기한 ‘LayerNorm’ 유사성을 근거로 타 모델의 가중치를 재사용했다는 주장은 통계적 착시에 불과하다”고 설명했다. 해당 구간은 모델 전체의 약 0.0004%에 불과한 미세 영역으로, 오히려 솔라 오픈의 99.9996%가 타 모델과 완전히 상이함을 보여주는 역설적 지표라는 설명이다.
또한 LayerNorm 유사성 판단에 사용된 ‘코사인 유사도’ 역시 적절한 비교 기준이 아니라고 강조했다. 김 대표는 “코사인 유사도는 벡터의 방향만 비교하는 단순 지표로, 통상 언어모델들의 LayerNorm은 비슷한 구조와 특성을 공유하기 때문에 독립적인 모델 간 유사도가 높은 값으로 나오는 것이 오히려 자연스러운 현상”이라고 반박했다.
이미지 확대보기이외에도 특정 모델과 구조·코드가 유사하다는 지적과 특정 모델의 소스코드를 가져와 라이선스를 조작했다는 의혹에 대해서도 사실과 다르다고 강조했다.
김 대표는 “업스테이지를 포함한 주요 오픈소스 LLM 개발사들은 학습용 코드를 외부에 공개하지 않는다”며 “공개된 모델 카드나 구조 설명을 참고해 연구 방향의 아이디어를 얻는 것은 가능하지만, 접근 자체가 불가능한 학습 코드를 재사용해 모델을 개발한다는 주장은 기술적으로 성립할 수 없다”고 반박했다.
이어 “업스테이지는 더 많은 개발자들이 솔라 오픈을 쉽게 써볼 수 있도록 인퍼런스 코드를 공개했으며, 이 과정에서 서빙 호환성을 높이기 위해 허깅페이스의 공개 오픈소스 코드베이스 일부를 활용했다”며 “이는 누구나 사용할 수 있는 ‘아파치 2.0(Apache 2.0)’ 라이선스에 따라 통상적으로 사용되는 것으로, 해당 라이선스 출처를 정확히 표기하기 위해 문구를 업데이트한 것”이라고 설명했다.
김 대표는 “앞으로도 업스테이지는 투명한 기술 공개를 바탕으로 글로벌 최고 수준의 기술력을 증명하고 국내 AI 생태계 확장에 힘쓰겠다”고 밝혔다.
정채윤 한국금융신문 기자 chaeyun@fntimes.com
[관련기사]
가장 핫한 경제 소식! 한국금융신문의 ‘추천뉴스’를 받아보세요~
데일리 금융경제뉴스 Copyright ⓒ 한국금융신문 & FNTIMES.com
저작권법에 의거 상업적 목적의 무단 전재, 복사, 배포 금지







![작지만 복지는 동종 업계 최고 대기업 계열사 ‘넥슨게임즈’ [女기어때?]](https://cfnimage.commutil.kr/phpwas/restmb_setimgmake.php?pp=006&w=110&h=79&m=5&simg=20260102133028044397492587736121125197123.jpg&nmt=18)


![[정답은 TSR] 한국타이어, 작년 말 스퍼트 이어갈까](https://cfnimage.commutil.kr/phpwas/restmb_setimgmake.php?pp=006&w=110&h=79&m=5&simg=20260105152228017177492587736121125197123.jpg&nmt=18)
