금융사 어플리케이션에서 주로 이용하는 서비스들이기에 '은행'이라고 답할 수 있겠지만, 정답은 '금융결제원'이다.
5대 국가기간전산망의 하나인 금융전산망을 만들었고, ▲CD공동망 ▲타행환공동망 ▲전자금융공동망 ▲어음교환 ▲지로 등 지급결제시스템과 같은 금융 분야 핵심인프라를 구축·운영한다.
금융말뭉치, 금융AI 필수 요소
금융결제원의 주요 사업은 ▲결제 ▲페이먼트 ▲데이터 ▲인증 등 다양하지만, 올해 중점 사업은 단연 '금융말뭉치 구축'이다.금융말뭉치는 국내 금융권에 특화된 AI 서비스를 개발하기 위한 필수 요소다. 현재 대부분의 생성형 AI는 영어권 언어로 된 일반 데이터를 활용하고 있는데, 국내 금융사에서 이를 그대로 활용하기에는 전문성·정확성·신뢰성 측면에서 어려움이 많기 때문이다.
AI가 전문용어나 문맥 속에 함축된 의미를 파악하고 자연스럽게 응답하기 위해서는 다양한 형태의 언어 패턴과 규칙에 대한 학습이 필요한데, 금융말뭉치는 AI의 '한글판 참고서' 역할을 한다.
금융말뭉치는 수집, 생성, 검수, 제공의 네 단계를 통해 구축·제공된다.
먼저, 금융 법규·정책·연구·보도자료와 교육자료 등 양질의 원천 데이터를 '수집'한 후 금융사들이 별도의 가공 없이 AI 도입에 즉시 활용할 수 있는 금융말뭉치로 '생성'한다.
이후 말뭉치의 형태적·내용적 '검수'를 반복하는 절차를 거쳐 금융사에 '제공'하면, 금융사가 생성형 AI 모델 학습과 검증에 다양하게 활용하는 구조다.
금융결제원 관계자는 "AI 기술·금융 전문가 약 20여명 이상이 두 달이상 집중적으로 검수해 금회사가 실질적으로 활용할 수 있는 말뭉치를 구축했다"며 "체계적인 금융말뭉치 관리와 업데이트를 통해 최신의 금융정보가 제공될 수 있도록 지원할 예정"이라고 밝혔다.
ㅇ 45GB 규모 용도별 금융말뭉치 구축
이번에 구축된 금융말뭉치는 총 12,600건, 약 45GB 이상 규모다.금융사들의 사용 목적에 따라 ▲학습용 ▲검색증강생성용 ▲평가지원용 말뭉치로 구분되는데, 먼저 '학습용' 말뭉치는 AI 모델의 금융 전문지식 습득을 위해 제공된다.
한국어로 된 금융용어에 대한 이해력과 국내 금융제도·법규 등에 대한 전문성 향상이 목적이다.
'검색증강생성(RAG)용'의 경우 AI 모델이 외부의 최신 정보, 전문 데이터를 참조해 더욱 정확한 답변을 도출할 수 있도록 지원하기 위한 말뭉치다.
AI 모델이 금융제도나 법규의 최신 개정 내용이 반영된 답변을 도출하게 함으로 고객의 권리와 재산을 보호할 수 있도록 한다.
AI 모델의 금융 지식, 추론능력과 잠재적 유해성을 평가하기 위한 '평가지원용' 말뭉치도 제공된다.
생성형 AI가 허구의 내용을 실제 정보처럼 생성하는 '환각'이나, 인종·성별 선입견을 학습하는 '편향' 등의 문제 등의 문제가 발생하지 않도록 객관적인 성능과 공정성을 검증하기 위한 것이다.
이재득 금융결제원 AI혁신반 팀장은 “금융 데이터는 일반적인 언어 데이터와는 달리 정확성과 신뢰성이 필수적”이라며 “이번 사업은 신뢰할 수 있는 금융말뭉치 제공을 목표로 하고 있으며, 이를 기반으로 국내 금융 산업이 경쟁력을 강화하고 글로벌 시장에서도 가치를 인정받을 수 있도록 꾸준히 노력하겠다”고 밝혔다.
금융결제원은 지난 3월 31일부터 금융말뭉치 시범사업을 시작했다. 오는 6월에는 본사업 실시, 시범사업에서 제공되지 않았던 보도자료와 교육자료 기반 말뭉치도 포함할 예정이다. 이에 더해 금융관련 모든 법률에 대해 API 형태의 검색 증강용(RAG) 금융 말뭉치가 제공되며 금융회사별 특성에 맞게 가공할 수 잇는 '중간재 말뭉치'도 배포할 예정이다.
김성훈 한국금융신문 기자 voicer@fntimes.com
가장 핫한 경제 소식! 한국금융신문의 ‘추천뉴스’를 받아보세요~
데일리 금융경제뉴스 Copyright ⓒ 한국금융신문 & FNTIMES.com
저작권법에 의거 상업적 목적의 무단 전재, 복사, 배포 금지