카카오와 엔씨소프트는 타사의 범용 LLM에 비해 적은 매개변수(13억개~1000억개)를 활용하는 중소형 언어모델 출시를 예고했다. LG의 엑사원2.0이 3000억개, 네이버의 하이퍼클로바 2040억개, 오픈AI의 챗GPT-3.5 1750억개, 구글의 팜 5400억개 매개변수를 사용한 데 비해 훨씬 작은 규모다. 서비스 맞춤형 AI 언어모델을 제공, 비용 효율성으로 승부를 보겠다는 구상이다.
엔씨소프트는 지난 16일 자체적으로 개발한 AI 언어모델 ‘바르코 LLM’을 공개했다. 국내 게임업계 최초다.
엔씨의 자체 언어모델은 ▲기초 모델 ▲인스트럭션 모델 ▲대화형 모델 ▲생성형 모델 등 총 네 가지로 나뉜다. 각각 매개변수 규모에 따라 성능이 구분된다.
이용자는 LLM을 활용해 간단한 일상 대화용 챗봇부터 문서요약이나 정보추출 등 AI 서비스 개발을 할 수 있을 것으로 보인다. 학습 데이터로는 AI 허브, 국립국어원, Common crawl(커먼크롤) 등에 공개된 자료를 활용했다.
엔씨는 이달 말 한국어와 영어를 모두 하는 이중언어 모델을 잇달아 출시한다. 또 ▲9월 창작 특화 언어모델 ▲11월 바로코 스튜디오(이미지, 텍스트, 디지털 휴먼 등 AI 플랫폼 서비스) 사내 런칭 ▲11월 대형 모델(매개변수 520억개) ▲내년 3월 멀티 모달 모델(매개변수 1000억개) ▲내년 상반기 바로코 스튜디오 외부 공개 등을 목표로 하고 있다.
카카오(대표 홍은택닫기홍은택기사 모아보기)도 오는 10월 AI 언어모델 ‘코GPT 2.0’ 출시를 앞두고 한창 사내 테스트를 진행하며 모델을 고도화시키고 있다.
카카오는 합리적으로 적정 크기의 모델을 만들어 서비스에 적용한다는 계획이다. 비용과 퍼포먼스가 적절한 균형을 이룰 수 있도록 해 투자 효율을 높인다는 구상이다.
예를 들어 카카오톡 메시지 요약 등 비교적으로 난이도가 낮은 서비스에는 작은 파라미터 규모의 경량형 모델을 적용하는 식이다.
현재 내부에서 매개변수 60억개, 130억개, 250억개, 650억개 등 다양한 규모의 모델을 테스트하면서 비용 합리적인 AI 모델을 만드는 중인 것으로 알려졌다.
특히 카카오는 자회사 카카오엔터프라이즈에서 제공하는 AI 학습·추론 관련 클라우드 인프라 활용을 확대해 투자 비용을 내재화할 예정이다.
AI와 결합할 여러 서비스 중 카카오톡 비즈니스 커뮤니케이션에서 가장 먼저 성과가 날 전망이다. 배달이나 여행 등 업종에서 제공하는 주문·예약·상담·결제 등 서비스에 AI를 접목하면 일대일 양방향 커뮤니케이션이 가능해져 유의미한 성과가 날 수 있다는 거다.
홍은택 카카오 대표는 지난 2분기 실적 발표 컨퍼런스콜에서 “누가 먼저 초거대 언어모델을 구축하는지가 아니라 누가 비용 합리적으로 적정 모델을 만들어 서비스에 적용하느냐가 핵심”이라고 말했다.
이주은 기자 nbjesus@fntimes.com
[관련기사]
가장 핫한 경제 소식! 한국금융신문의 ‘추천뉴스’를 받아보세요~
데일리 금융경제뉴스 Copyright ⓒ 한국금융신문 & FNTIMES.com
저작권법에 의거 상업적 목적의 무단 전재, 복사, 배포 금지