자연어처리 분야 글로벌 최고 AI학회 연구 성과 발표
새로운 검색시스템 MERLIN으로 검색어와 검색된 영상 간의 불일치 해결
[한국금융신문 박슬기 기자] 올인원 커머스AI 구독서비스 ‘에이플러스 AI’를 운영하고 있는 버즈니(대표 남상협·김성국)는 다음 달 미국에서 열릴 세계 최고 권위 자연어처리 학회 ‘EMNLP 2024’에서 영상 검색 기술 관련 연구 논문을 발표할 예정이라고 26일 밝혔다.
11월 12~16일까지 미국 플로리다에서 진행될 EMNLP는 자연어처리 분야 글로벌 최고 AI 학회 중 하나다. 버즈니는 ‘대규모 언어 모델을 활용한 텍스트 비디오 검색 및 재정렬 파이프라인을 위한 반복적 피드백 학습 기반 다중 모달 임베딩 정제 기법’에 대한 연구를 발표할 예정이다.
이 연구는 멀티미디어 콘텐츠의 급속한 증가로 인해 대규모 영상 데이터에서 관련된 영상을 정확하게 검색하는 어려움에 주목했고, 이를 해결하기 위해 MERLIN (Multimodal Embedding Refinement via LLM-based Iterative Navigation for Text-Video Retrieval-Rerank Pipeline)이라는 새로운 검색 시스템을 제안했다.
MERLIN은 대규모 언어 모델(LLM)을 활용해 반복적인 피드백 학습 과정을 거쳐 사용자의 검색어와 검색된 영상 간의 불일치를 해결하고, 검색 정확도를 크게 향상시킨다.
이 기술은 버즈니의 올인원 커머스AI 구독서비스 ‘에이플러스AI’에서 제공하고 있는 기술 중 하나인 ‘숏폼 AI’에 우선 적용해 성능을 높이는데 기여할 예정이다. ‘숏폼 AI’는 AI가 자동으로 영상의 핵심을 추출해 1분 이하의 숏폼 콘텐츠를 자동 생성하는 기술로 현재 CJ온스타일과 신세계라이브쇼핑 등에 제공하고 있다.
남상협 버즈니 대표는 “이번 성과는 지난 10년 넘는 기간 커머스AI 연구 개발에 적극 투자해 온 버즈니의 기술력이 세계 무대에서도 인정받은 것”이라며 “앞으로도 에이플러스AI 기술을 도입한 고객사의 업무 효율성 향상 및 매출 극대화를 위해 커머스AI 기술에 대한 연구·개발(R&D) 투자를 지속해 나갈 계획”이라고 말했다.
(주)한국금융신문은 뉴스레터 구독(이메일 전송) 서비스를 위해 이메일주소를 수집합니다.
구독 서비스 신청자는 개인정보 수집·이용에 동의를 거부할 권리가 있습니다. 단, 거부 시 뉴스레터를 이메일로 수신할 수 없습니다.
뉴스레터 수신동의 해제는 뉴스레터 하단의 ‘수신거부’를 통해 해제할 수 있습니다.