LG AI연구원은 14일 설립 1주년을 맞아 온라인으로 진행한 ‘LG AI 토크 콘서트’에서 ‘엑사원’을 공개하고, 주요 연구 성과와 향후 계획을 발표했다.
◇말뭉치 6000억개·이미지 2억5000만장 등 세계 최대 규모의 데이터 학습
LG가 개발한 초거대 AI ‘EXAONE’은 ‘EXpert Ai for everyONE’의 축약어로 ‘인간을 위한 전문가 AI’를 의미한다. ‘EX’는 ‘전문가’라는 뜻 외에 10의 18승 즉, 100경(京)을 뜻하는 접두어 ‘EXA’의 의미도 갖는다.
LG AI연구원은 인류가 지금까지 사용한 모든 단어를 데이터로 저장한다고 가정할 때 그 양이 5엑사바이트(Exabyte)일 만큼 매우 큰 단위이며, 초거대 AI의 규모를 가늠하기에 적합한 단어라고 설명했다.
LG AI연구원은 지난 5월 향후 3년간 1억달러(약 1127억원) 이상을 투자해 초거대 AI를 연구한다고 발표한 바 있다.
이들은 인간의 뇌에서 정보를 학습하고 기억하는 시냅스와 유사한 역할을 하는 인공 신경망의 파라미터를 13억개, 130억개, 390억개, 1,750억개 등 단계적으로 키우며 초거대 AI를 개발해왔다. 파라미터는 AI가 딥러닝을 통해 학습한 데이터가 저장되는 곳으로, 이론상 파라미터가 많을수록 AI가 더 정교한 학습을 할 수 있다.
이날 공개된 ‘EXAONE’은 국내 최대인 약 3000억개의 파라미터를 보유하고 있다. 언어 뿐 아니라 이미지와 영상까지 인간의 의사 소통과 관련된 다양한 정보를 습득하고 다룰 수 있는 멀티 모달리티(Multi-Modality) 능력을 갖췄다.
LG AI연구원은 “멀티 모달 AI로 가는 첫 단계로 자체 개발한 알고리즘으로 언어를 이미지로, 이미지를 언어로 변환하는 기술을 구현했을 뿐 아니라 품질 역시 글로벌 최고 수준의 성능을 의미하는 SOTA(State-of-the-art)를 달성했다”고 설명했다.
향후 멀티 모달 AI 기술이 고도화되면, AI가 데이터를 습득해 이해하는 수준을 넘어 추론하고, 시각과 청각 등 다양한 감각 영역을 넘나드는 창조적 생성이 가능하다.
LG AI연구원은 이 같은 멀티 모달 AI를 개발하기 위해 말뭉치 6000억개와 언어, 이미지가 결합된 고해상도 이미지 2억 5000만장 이상을 학습하는 등 세계 최대 규모의 학습 데이터를 활용했다.
‘EXAONE’은 LG전자, LG화학, LG유플러스, LG CNS 등 LG 계열사들이 보유하고 있는 전문 데이터를 포함해 논문, 특허 등의 정제된 말뭉치들을 학습해 다양한 산업 분야에서 전문가로 활약할 수 있는 가능성을 높여 가고 있다.
또, 미국 AI 연구소 오픈AI가 개발한 초거대 AI인 GPT-3가 영어를 학습하고, 국내에서 개발 중인 다른 초거대 AI들이 한국어에 집중하는 것과 달리 ‘EXAONE’은 원어민 수준으로 한국어와 영어를 이해하고 구사하는 이중 언어 AI라는 점도 차별점이다.
◇ 글로벌 초거대 AI 생태계 조성 위한 3단계 계획 발표
LG AI연구원은 ‘EXAONE’을 제조, 연구, 교육, 금융 등 사실상 모든 분야에서 ‘상위 1% 수준의 전문가 AI’로 활약할 수 있도록 만들 계획이다.
특히 집단 지성으로 초거대 AI 생태계를 조성하기 위해 LG 계열사와의 협업을 통한 실증, 국내를 포함한 글로벌 AI 연합 결성해 활용 영역 확대, 초거대 AI 대중화를 통한 상생 환경 구축 등 3단계 계획을 발표했다.
우선 ‘EXAONE’을 사용할 수 있는 통로인 오픈 API(Application Programming Interface)를 LG 계열사들에게 공개해 전자·화학·통신 등 LG 사업 전반에 초거대 AI를 적용할 수 있도록 했다.
또 금융, 패션, 유통, 교육 등 다양한 글로벌 파트너사와 함께 연합(Alliance)을 결성해 초거대 AI 활용 영역을 넓혀 나갈 계획이다.
AI연구원은 “궁극적으로 초거대 AI를 일부 기업이 독점하는 것이 아니라, 일반 대중까지 공개하는 대중화를 통한 상생 환경 구축 방안도 검토 중”이라고 밝혔다.
◇올해 AI학회 논문 18건 채택…내년 25건 이상 난제 해결 목표
LG AI연구원은 이날 행사에서 지난해 12월 출범 이후 1년간의 성과들도 공개했다.
연구 분야에서는 ‘최적 경로 강화 학습’, ‘작곡 하는 AI’ 등 올해에만 18건의 논문이 AAAI, CVPR, ICLR, NeurlPS 등 세계 최고 권위의 인공지능 학회에서 채택되는 성과를 거뒀다. 또, LG 계열사들은 올해에만 18건의 난제를 해결했으며, 내년에는 25건 이상의 난제 해결을 목표로 하고 있다.
배경훈 LG AI연구원장은 “어려운 난제를 해결하기 위해 끊임없이 도전하고, 우수한 연구 성과를 바탕으로 고객에게 꼭 필요한 전문가 AI를 만드는 연구원이 되고자 한다”며, “캐나다 토론토대, 미국 미시건대, 서울대, 카이스트 등 국내외 주요 대학 및 석학들과 연구개발 연계 체계를 더욱 강화하고, 향후 API 공개 및 외부 파트너십을 통해 집단 지성으로 글로벌 초거대 AI 생태계를 만드는 데 기여할 것”이라고 말했다.
정은경 기자 ek7869@fntimes.com
[관련기사]
가장 핫한 경제 소식! 한국금융신문의 ‘추천뉴스’를 받아보세요~
데일리 금융경제뉴스 Copyright ⓒ 한국금융신문 & FNTIMES.com
저작권법에 의거 상업적 목적의 무단 전재, 복사, 배포 금지