양사, 세계 최고 수준 PDF 데이터 로더 공동 개발
글로벌 오픈소스 시장 본격 진출…생태계 기여 강화
이미지 확대보기(왼쪽부터) 김연수 한컴 대표와 보리스 두브로브 듀얼랩 대표가 협약 후 기념사진을 촬영하고 있다. / 사진=한글과컴퓨터
[한국금융신문 정채윤 기자] 한글과컴퓨터(대표이사 변성준∙김연수, 이하 한컴)가 글로벌 오픈소스 전문 기업 ‘듀얼랩’과 협력해 오픈소스 시장에 본격적으로 진출한다.
한컴은 듀얼랩과 ‘오픈 PDF 데이터 로더’의 공동 개발 및 사업 협력을 위한 양해각서(MOU)를 체결하고, 인공지능(AI) 기술 기업으로의 전환에 속도를 낸다고 9일 밝혔다.
최근 오픈소스 기반 AI 생태계는 급속한 성장을 보여주고 있다. AI 호스팅 플랫폼 '허깅페이스'에 등록된 AI 모델 수는 100만 건을 돌파하며 이 같은 분위기를 여실히 드러내고 있다.
한컴 또한 오픈소스를 기반으로 전 세계 개발자들과의 협업에 나선다. 한컴은 PDF 데이터 추출 기술을 오픈소스로 공개함으로써 글로벌 오픈소스 생태계에 기여하고, 동시에 기술 경쟁력도 강화할 계획이다.
양사가 공동 개발하는 오픈 PDF 데이터 로더는 PDF 문서에서 데이터를 빠르고 정밀하게 추출할 수 있도록 지원하는 소프트웨어 개발 도구(SDK)다. 한컴은 세계 최고 수준의 오픈 PDF 데이터 로더라는 기술적 위상을 확보하고, 다양한 AI 모델과 손쉽게 연동할 수 있는 유연한 구조를 강점으로 내세운다. 이를 바탕으로 오픈소스 생태계를 통해 전 세계 개발자, 커뮤니티, 그리고 기업 사용자들과의 협업을 확대해 나갈 예정이다.
듀얼랩은 PDF 기술 표준을 관장하는 ‘PDF 협회’의 정회원이며, 세계적으로 인정받는 PDF/A 유효성 검사 도구인 ‘베라PF(veraPDF)’의 오픈소스 기술 개발을 주도해 왔다. 한컴은 듀얼랩이 보유한 풍부한 오픈소스 개발 경험과 글로벌 네트워크를 활용해 프로젝트의 안정적인 시장 안착을 도모하고, 오픈소스 생태계 내에서 주도권을 확보해 나가겠다는 복안이다.
한컴은 이미 AI 기반 데이터 추출 기술 분야에서 가시적인 성과를 거두고 있다. 대표 제품인 ‘한컴 데이터 로더’는 기업이 외부로의 데이터 유출 우려 없이 자체 보유한 문서를 활용해 거대언어모델(LLM)을 학습시킬 수 있도록 지원하는 솔루션이다. 이 제품은 PDF를 비롯해 HWPX, 워드, 파워포인트 등 다양한 형식의 문서에서 텍스트는 물론, 표와 이미지 같은 객체까지 정확하게 추출함으로써 검색증강생성(RAG) 기술의 효율성을 극대화한다.
이번 오픈 PDF 데이터 로더 개발은 듀얼랩의 PDF 데이터 추출 기술과 한컴의 AI 기술력을 결합해, PDF 문서에 특화된 오픈소스 버전을 선보이고 글로벌 시장 저변을 확대하려는 로드맵의 일환이다.
한컴은 오픈소스의 공유 가치를 실현하면서도 지속 가능한 사업 모델을 구축하기 위해 ‘오픈 코어’ 전략을 채택한다. 이에 따라 핵심적인 PDF 데이터 추출 SDK는 누구나 자유롭게 사용할 수 있도록 공개하고, 광학문자인식(OCR)의 정밀도를 높이거나 표, 수식, 차트 등을 고도화된 AI 기술로 인식하는 기능은 별도의 상용 ‘애드온’ 형태로 출시해 수익을 창출할 계획이다.
김연수닫기김연수기사 모아보기한컴대표는 “이번듀얼랩과의협력은한컴이축적해온문서기술력과최신 AI, 오픈소스트렌드를결합해글로벌시장에본격진출하는중요한전환점”이라며 “단순한제품출시를넘어개방과협력의가치를바탕으로전세계개발자들과함께성장하는기술생태계를구축하고, 이를통해한컴이글로벌 AI 서비스기업으로도약하는기반을마련하겠다”고말했다.
(주)한국금융신문은 뉴스레터 구독(이메일 전송) 서비스와 당사 주관 또는 제휴·후원 행사 및 교육에 대한 안내를 위해 이메일주소를 수집합니다.
구독 서비스 신청자는 개인정보 수집·이용에 동의를 거부할 권리가 있습니다. 단, 거부 시 뉴스레터를 이메일로 수신할 수 없습니다.
뉴스레터 수신동의 해제는 뉴스레터 하단의 ‘수신거부’를 통해 해제할 수 있습니다.