LG AI연구원(원장 배경훈)이 19일 서울 강서구 마곡 LG사이언스파크 컨버전스홀에서 ‘LG AI 토크 콘서트 2023’을 열고 초거대 멀티모달 AI ‘엑사원(EXAONE) 2.0’을 공개했다.
배경훈 LG AI연구원장은 행사에서 “LG는 국내에서 유일하게 이중 언어 모델과 양방향 멀티모달 모델을 모두 상용화한 기업이며, 세상의 지식을 이해하고 발견하는 상위 1%의 전문가 AI를 개발하고 있다”며 “국내외 파트너사와의 협력을 통해 실질적인 성공 사례를 만들어가며 ’다른 생성형 AI들과는 차별화된 고객 가치’를 창출하는 글로벌 경쟁력을 갖춘 AI 컴퍼니로 발전해 나갈 것”이라고 강조했다.
한국어와 영어 이해하는 ‘엑사원 2.0’…맞춤형 AI로 설계
LG AI연구원은 2021년 12월 처음 선보인 초거대 멀티모달 AI ‘엑사원’을 공개한 이후 LG 계열사와 국내외 파트너사들과 각 분야에 특화된 전문가 AI를 만들기 위한 연구개발을 지속해왔다.LG AI연구원은 앞으로도 저작권, 신뢰성 등 AI 윤리 원칙을 준수하며 데이터 학습을 진행할 계획이다.
엑사원 2.0은 한국어와 영어를 동시에 이해하고 답변할 수 있는 이중 언어 모델로 개발됐다. 현존하는 전문지식 데이터의 상당수가 영어로 되어 있는 점을 고려한 것이다. 학습 데이터양도 기존 모델 대비 4배 이상 늘렸다.
‘엑사원 2.0’의 언어 모델은 기존 모델과 성능은 동일하지만, 추론 처리 시간은 25% 단축했다. 메모리 사용량도 70% 줄여 비용을 약 78% 절감했다. 이미지 생성 품질을 높이고자 메모리 사용량을 2배 늘렸지만, 추론 처리 시간을 83% 단축해 약 66%의 비용 절감을 달성했다.
‘엑사원 2.0’은 고객들이 원하는 용도나 예산에 맞게 모델의 크기부터 종류(언어, 비전, 멀티모달), 사용 언어까지 맞춤형으로 설계할 수도 있다.
LG AI연구원은 고객 데이터 보안을 위해 학습 과정을 미세 조정하는 파인 튜닝과 AI 인프라를 고객이 보유한 서버에 직접 설치하는 구축형 및 사설 클라우드 방식도 지원한다.
LG AI연구원은 대표적인 엑사원 활용 사례로 LG전자의 AICC(AI 컨택 센터)를 소개했다. AICC는 고객과의 상담 내용을 실시간으로 분석·요약하고 상담 내용에 적합한 답변이나 콘텐츠를 제안한다. 상담사 만족도도 95점을 넘길 만큼 긍정적인 피드백이 이어지고 있다.
LG AI연구원은 국내에서 시범 운영 중인 AICC를 하반기 중 정식 서비스로 전환할 예정이며, 내년부터 영어권 국가로 확대할 계획이다.
전문가용 대화형 AI 플랫폼 ‘엑사원 유니버스’ 공개
LG AI연구원은 이날 ‘전문가 AI’ 서비스 개발의 기반인 엑사원 3대 플랫폼인 △유니버스 △디스커버리 △아틀리에를 차례로 공개했다. ‘엑사원 유니버스’는 △질의응답·대화 △텍스트 분류·요약 △키워드 추출·생성 △번역 등 기능별로 메뉴를 나눴던 방식에서 전문가용 대화형 AI 플랫폼으로 진화했다.
다른 대화형 AI와 달리 사전 학습한 데이터는 물론 각 도메인별 최신 전문 데이터까지 포함한 근거를 바탕으로 답변을 생성한다. 질문에 대한 답변과 함께 화면 좌측과 우측에 각각 질문과의 연관성이 가장 높은 전문 문헌들과 AI가 답변하는 과정에서 활용한 단락을 표시한다.
이문태 Advanced ML 랩장은 “전문가들에게 인사이트를 제공하기 위해 최신 DB에서 관련 문서를 전부 파악하고 다시 문서 속 세부적인 근거들을 추론한 뒤 서로 다른 근거들을 종합해 인사이트를 만드는 종합적·논리적 추론 기능을 설계했다”고 설명했다.
이렇다 보니 거짓을 진실처럼 대답하는 다른 대화형 AI가 가진 ‘환각 현상’ 이슈를 최소화했다. 세종대왕이 맥북을 던진 사건도, 명품 패딩을 거친 교황 오보 사건 등도 엑사원에선 도출할 수 없는 답변이다.
이문태 랩장은 “엑사원 유니버스를 각 분야의 전문가들이 믿고 정보를 탐색하며 인사이트를 찾을 수 있는 플랫폼으로 만들기 위해 전문성과 신뢰성을 높이는 데 주력했다”고 설명했다.
엑사원 유니버스의 AI·머신러닝 분야 서비스는 7월 31일부터 LG 그룹 내 AI 연구자, 협력 중인 대학을 대상으로 비공개 베타 서비스를 진행한다. 9월에는 LG에서 AI를 연구하거나 공부하는 임직원 대상으로 정식 서비스를 진행할 계획이다.
LG AI연구원은 화학, 바이오, 제약, 의료, 금융, 특허 등 엑사원 유니버스의 각 전문 도메인별 특화 서비스도 준비 중이다.
신소재·신약 개발 돕는 ‘엑사원 디스커버리’
LG AI연구원은 화학 및 바이오 분야의 발전을 앞당길 ‘엑사원 디스커버리’도 선보였다. 세상에 없던 새로운 지식을 발견하는 플랫폼으로 가장 먼저 신소재·신물질·신약 관련 탐색에 적용하고 있다. LG AI연구원은 엑사원 디스커버리에 논문과 특허 등 전문 문헌의 텍스트뿐만 아니라 분자 구조, 수식, 차트, 테이블, 이미지 등 비(非)텍스트 정보까지 AI가 읽고 학습할 수 있는 형태로 데이터베이스(DB)화하는 심층 문서 이해(DDU) 기술을 적용했다.
엑사원 디스커버리는 신소재 개발 시 일반적으로 40개월 소요되는 연구개발 기간을 5개월까지 단축할 수 있을 것으로 기대했다.
LG AI연구원은 이날 친환경 배터리 개발에 활용할 수 있는 첨가제 소재의 개발을 주제로 엑사원 유니버스와 엑사원 디스커버리를 연계해 AI에 질문하며 ▲전문 문헌 검토 ▲분자 정보 추출 ▲소재 구조 설계(UMD) ▲소재 합성 예측(NCS) 등 후보 소재를 찾아내 합성 결과를 예측하는 과정을 시연했다.
한세희 Materials Intelligence 랩장은 “이전까지 연구된 결과를 분석하고, 가설 수립하고 실험하는 것을 무수히 반복해야 물질을 얻을 수 있었다면, 디스커버리는 가설 수립과 실험, 실패 과정을 획기적으로 줄이는 등 실험 실패 리스크를 최소화할 수 있다”고 설명했다.
엑사원 디스커버리는 올 4분기에 그룹 내 화학 및 바이오 분야 연구진들을 대상으로 서비스가 제공될 예정이다.
이미지 생성부터 동화까지 창작하는 ‘엑사원 아틀리에’
‘엑사원 아틀리에’는 인간에게 창의적 영감과 아이디어를 제공하기 위해 개발한 플랫폼이다.엑사원 아틀리에는 저작권이 확보된 이미지-텍스트가 짝을 이룬 페어(Pair) 데이터 3억5000장을 학습한 엑사원 2.0을 기반으로 이미지 생성과 이미지 이해에 특화된 기능을 제공한다.
LG AI연구원은 인간과 AI가 상호작용을 통해 디자인을 완성해가는 ‘디자인 싱킹 프로세스’를 엑사원 아틀리에에 접목하기 위해 미국 파슨스 디자인 스쿨과의 공동 연구개발을 이어가고 있다고 설명했다.
또, 지난 6월 셔터스톡(Shutterstock)과 함께 상용화한 ‘캡셔닝 AI’ 기능도 엑사원 아틀리에에 탑재했다. 캡셔닝 AI는 처음 보는 이미지까지 자연어로 설명할 수 있으며, 이미지 검색에 활용할 수 있는 정보인 문장이나 키워드 등의 메타 데이터를 생성한다.
LG AI연구원은 이날 제품 이미지를 보고 마케팅 문구 등을 생성하는 엑사원 아틀리에의 새로운 서비스를 시연했다.
LG생활건강의 패키지 이미지의 광고 문구를 생성해달라고 요청하자 한국어는 물론 영어까지 두 가지 버전의 광고 문구를 창작해냈다. SNS 피드 문구 작성을 요구하면 피드 문구는 물론 해시태그까지 생성해냈다.
실제로 LG생활건강은 최근 엑사원 아틀리에를 통해 화장품 ‘숨37’ 패키지 디자인을 제작했다.
배 원장은 “저작권 문제가 있는 데이터는 전혀 포함시키지 않았다. 디자이너는 아틀리에를 활용해 세상에 존재하지 않았던 새로운 이미지를 생성하면서 디자인 콘셉트를 구체화할 수 있다”고 말했다.
LG AI 연구원은 엑사원 아틀리에 서비스를 올 3분기 그룹 내외부의 전문 디자이너를 대상으로 시작할 방침이다. 또 SNS 등에 유용하게 사용될 수 있는 만큼 B2C향으로도 개발을 이어갈 계획이다.
끝으로 배 원장은 “2021년 엑사원을 처음 발표한 뒤 2년 넘게 생성형 AI를 연구해오고 있다. 많은 시행착오가 있었고, 어떤 분야에 적용하는 것이 경쟁력 있을지 고민해왔다”라며 “아직 엑사원 2.0이 완벽하지 않을 수 있겠지만 부족한 부분을 개선하고 장점을 살려 좋은 성공 사례를 만들어 나가겠다”고 말했다.
정은경 기자 ek7869@fntimes.com
[관련기사]
가장 핫한 경제 소식! 한국금융신문의 ‘추천뉴스’를 받아보세요~
데일리 금융경제뉴스 Copyright ⓒ 한국금융신문 & FNTIMES.com
저작권법에 의거 상업적 목적의 무단 전재, 복사, 배포 금지