

SKT는 오픈소스 커뮤니티 허깅페이스에 ‘에이닷 엑스 인코더’와 ‘에이닷 엑스 4.0 VL 라이트’ 2종을 공개했다고 29일 밝혔다. 이 모델은 학술 연구나 상업 이용 등에 자유롭게 활용 가능하다.
에이닷 엑스 인코더는 1억4900만개(149M)의 매개변수를 바탕으로 작동하며, 자연어 이해 성능지표 평균 85.47점을 달성해 글로벌 최고수준(SOTA)급 성능을 확인했다. 기존 글로벌 오픈소스 모델을 기반으로 KLUE 팀에서 공개한 ‘RoBerTa-base’ 성능지표(80.19점)를 상회하는 수준이다.
에이닷 엑스 인코더는 1만6384개의 토큰까지 처리 가능해 기존 모델들보다 최대 3배의 추론속도와 2배의 학습속도를 구현할 수 있다. 기존 모델들이 512개의 토큰을 처리해 보통 문장 혹은 문단 정도의 처리가 가능했다면, 그보다 월등히 큰 문맥을 빠르고 효율적으로 처리한다.
에이닷 엑스 4.0 VL 라이트는 대규모 멀티모달 한국어 데이터셋이 학습된 시각-언어모델(VLM)이다. 한국어와 관련된 시각정보 및 언어 이해뿐만 아니라, 표·그래프 이해, 제조 도면 이해와 같은 기업용 애플리케이션에서 탁월하다.
에이닷 엑스 4.0 VL 라이트는 70억 개(7B) 매개변수의 에이닷 엑스 4.0 라이트 모델을 기반으로 개발됐다. 사용자 시스템에 쉽게 적용 가능하면서도 중형 모델 수준의 강력한 성능을 자랑한다.
한국어 문화 및 맥락적 이해를 평가하기 위해 설계된 멀티모달 벤치마크인 K-Viscuit에서 80.2점을 기록했고, 복잡한 문서 구조와 차트·표를 이해하는데 중점을 둔 KoBizDoc 벤치마크에서는 89.8점을 달성했다. 각각 Qwen2.5-VL32B 모델보다 뛰어나거나(72.3점) 비슷한(88.8점) 수준이다.
SKT는 앞서 대규모 학습(CPT)에 기반한 A.X 4.0 모델 2종(표준·경량)과 프롬 스크래치 방식의 A.X 3.1 모델 2종(표준·경량)을 순차적으로 발표했다. 향후 발표할 A.X 4.0 추론형 모델 등을 통해 LLM의 활용도와 성능을 높여갈 계획이다.
김태윤 SKT 파운데이션 모델 담당은 “독자적인 기술력 확보가 소버린 AI의 핵심인 만큼, 자체 역량을 높이고 컨소시엄 기업들과의 협업에도 박차를 가해 글로벌 최고 수준의 AI 경쟁력을 확보할 것”이라고 말했다.
정채윤 한국금융신문 기자 chaeyun@fntimes.com
[관련기사]
가장 핫한 경제 소식! 한국금융신문의 ‘추천뉴스’를 받아보세요~
데일리 금융경제뉴스 Copyright ⓒ 한국금융신문 & FNTIMES.com
저작권법에 의거 상업적 목적의 무단 전재, 복사, 배포 금지